造价通

反馈
取消

热门搜词

造价通

取消 发送 反馈意见

梅尔倒频谱简介

2022/07/16477 作者:佚名
导读:梅尔倒频谱系数(Mel-Frequency Cipstal Coefficients, MFCC)是一组用来建立梅尔倒频谱的关键系数。由音乐讯号当中的片段,我们可以得到一组足以代表此音乐讯号之倒频谱,而梅尔倒频谱系数即是从这个倒频谱中推得的倒频谱(也就是频谱的频谱)。与一般的倒频谱不同 ,梅尔倒频谱最大的特色在于,于梅尔倒频谱上的频带是均匀分布于梅尔刻度上的,也就是说,这样的频带会较一般我们所看到

梅尔倒频谱系数(Mel-Frequency Cipstal Coefficients, MFCC)是一组用来建立梅尔倒频谱的关键系数。由音乐讯号当中的片段,我们可以得到一组足以代表此音乐讯号之倒频谱,而梅尔倒频谱系数即是从这个倒频谱中推得的倒频谱(也就是频谱的频谱)。与一般的倒频谱不同 ,梅尔倒频谱最大的特色在于,于梅尔倒频谱上的频带是均匀分布于梅尔刻度上的,也就是说,这样的频带会较一般我们所看到、线性的倒频谱表示方法,和人类非线性的听觉系统(audio system)更为接近。例如:我们在音讯压缩的技术中,便常常使用梅尔倒频谱来处理。

梅尔倒频谱系数通常是用以下方法得到的:

  1. 将一讯号进行傅里叶转换(Fourier transform)

  2. 将频谱映射(mapping)至梅尔刻度,利用三角窗函数(triangular overlapping window)

  3. 取对数(logarithm)

  4. 取离散余弦转换(discrete cosine transform)

  5. MFCC是转换后的频谱

取得梅尔倒频谱的方法众多,上述只是其中一种。

另外,ETSI在2000年左右有定义一套专为移动电话设计的梅尔倒频谱系数算法。

*文章为作者独立观点,不代表造价通立场,除来源是“造价通”外。
关注微信公众号造价通(zjtcn_Largedata),获取建设行业第一手资讯

热门推荐

相关阅读