梅尔倒频谱系数(Mel-Frequency Cipstal Coefficients, MFCC)是一组用来建立梅尔倒频谱的关键系数。由音乐讯号当中的片段,我们可以得到一组足以代表此音乐讯号之倒频谱,而梅尔倒频谱系数即是从这个倒频谱中推得的倒频谱(也就是频谱的频谱)。与一般的倒频谱不同 ,梅尔倒频谱最大的特色在于,于梅尔倒频谱上的频带是均匀分布于梅尔刻度上的,也就是说,这样的频带会较一般我们所看到、线性的倒频谱表示方法,和人类非线性的听觉系统(audio system)更为接近。例如:我们在音讯压缩的技术中,便常常使用梅尔倒频谱来处理。
梅尔倒频谱系数通常是用以下方法得到的:
将一讯号进行傅里叶转换(Fourier transform)
将频谱映射(mapping)至梅尔刻度,利用三角窗函数(triangular overlapping window)
取对数(logarithm)
取离散余弦转换(discrete cosine transform)
MFCC是转换后的频谱
取得梅尔倒频谱的方法众多,上述只是其中一种。
另外,ETSI在2000年左右有定义一套专为移动电话设计的梅尔倒频谱系数算法。