MFCC 特征其实就是梅尔频谱上的倒谱分析。

Mel-frequency cepstral coefficients (MFCCs)

首先会将音频信号分成短的帧,每帧用一组滤波器(通常是 Mel scale 滤波器)进行处理,然后对每一帧取对数,并进行离散余弦变换。输出一组系数,即 MFCCs。

可对照 JPEG 压缩中涉及的二维 DCT 变换,发现少了归一化因子 $2C(u)C(v)/L$:

🕒