音频是多媒体中的一种重要媒体。我们能够听见的音频信号的频率范围大约是20Hz-20kHz,其中语音大约分布在300Hz-4kHz之内,而音乐和其他自然声响是全范围分布的。声音经过模拟设备记录或再生,成为模拟音频,再经数字化成为数字音频。这里所说的音频分析就是以数字音频信号为分析对象,以数字信号处理为分析手段,提取信号在时域、频域内一系列特性的过程。
各种特定频率范围的音频分析有各自不同的应用领域。例如,对于300-4kHz之间的语音信号的分析主要应用于语音识别,其用途是确定语音内容或判断说话者的身份;而对于20-20kHz之间的全范围的语音信号分析则可以用来衡量各类音频设备的性能。所谓音频设备就是将实际的声音拾取到将声音播放出来的全部过程中需要用到的各类电子设备,例如话筒、功率放大器、扬声器等,衡量音频设备的主要技术指标有频率响应特性、谐波失真、信噪比、动态范围等。