1. 相关知识

1)采样率(Sample Rate):每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。一般音乐CD的采样率是44100Hz,所以视频编码中的音频采样率保持在这个级别就完全足够了,通常视频转换器也将这个采样率作为默认设置。

2)帧率(Frame rate):是用于测量显示帧数的量度。所谓的测量单位为每秒显示帧数(Frames per Second,简称:FPS)或“赫兹”(Hz)。

3)码率(Bit Rate):指视频或音频文件在单位时间内使用的数据流量,该参数的单位通常是Kbps,也就是千比特每秒。通常2000kbps~3000kbps就已经足以将画质效果表现到极致了。码率参数与视频文件最终体积大小有直接性的关系

正常人听觉的频率范围大约在20Hz~20kHz之间,根据奈奎斯特采样理论,为了保证声音不失真,采样频率应该在40kHz左右。常用的音频采样频率有8kHz、11.025kHz、22.05kHz、16kHz、37.8kHz、44.1kHz、48kHz等,如果采用更高的采样频率,还可以达到DVD的音质

对采样率为44.1kHz的AAC音频进行解码时,通常是按1024个采样点一帧, 所以一个AAC格式的音频帧的样本数是1024

2. 音频帧和采样率的关系

音频帧的播放时间 = 音频帧的样本个数 / 采样频率(单位为s)

以几种常用的音频格式举例:

1) AAC

一帧 1024个 sample。采样率 sample_rate 为 44.1KHz,即每秒44100个sample, 所以根据公式   音频帧的播放时间 = 一个AAC帧对应的采样样本的个数 / 采样频率
那么AAC格式一帧的播放时间是= 1024*1000/44100= 22.32ms(单位为ms)

2)  MP3
MP3 每帧均为1152个字节, 则:
frame_duration = 1152 * 1000 / sample_rate
例如:sample_rate = 44100HZ时,计算出的时长为26.122ms,这就是经常听到的mp3每帧播放时间固定为26ms的由来。

参考链接
1. 音频帧概念详解