音视频播放器的工作的具体流程如下图所示:
简单的来说包括:解协议,解封装,对音频和视频分别进行解码,音视频同步播放这几个部分,各部分详细解释请看后面参考资料。由于我们是分别解码和播放音频和视频的,所以各自播放的节奏需要同步,否则会出现音画不一致的情况。本文主要介绍一个简单的音视频同步的方案。
准备工作
相关知识
- PTS和DTS
音视频流中的每一帧都有时间相关的信息,其中PTS是播放时间,DTS是解码时间。音频的PTS和DTS是一致的,而某些视频各种中可能会存在DTS和PTS不一致的帧,我们这里主要通过PTS来控制播放时间。对解码后的AVFrame使用av_frame_get_best_effort_timestamp可以获取PTS。 - time_base
我们注意到PTS是一个整形数据,time_base是PTS的单位,PTS乘以time_base即可得到实际时间。只有AVStream中获取的time_base才是对的,其他地方获取的可能会有问题。 - 音视频同步策略
一般来说有三种方式,音频同步到视频,视频同步到音频,音视频同步到外部时间。一般各个参数设置正确音频就能够以正常的速度播放,所以把视频同步到音频在一般情况下,是一个简单有效的同步策略。本文主要采取这个方式同步音视频,来展示相关的基本思路。
同步视频到音频
- 获取解码的视频帧时间。
AVFrame vFrame;
AVStream vStream;
//...解析视频获取vStream,解码视频帧获得vFrame...
double timestamp = av_frame_get_best_effort_timestamp(&vFrame)*av_q2d(vStream->time_base);
- 获取解码的音频帧时间。
AVFrame aFrame;
AVStream aStream;
//...将正在播放的音频时间点记录下来作为基准...
audioClock = aFrame.pkt_pts * av_q2d(aStream->time_base);
- 音视频同步逻辑
/* no AV sync correction is done if below the minimum AV sync threshold */
#define AV_SYNC_THRESHOLD_MIN 0.04
/* AV sync correction is done if above the maximum AV sync threshold */
#define AV_SYNC_THRESHOLD_MAX 0.1
/* If a frame duration is longer than this, it will not be duplicated to compensate AV sync */
#define AV_SYNC_FRAMEDUP_THRESHOLD 0.1
/* no AV correction is done if too big error */
#define AV_NOSYNC_THRESHOLD 10.0
double timestamp;
//判断是否有有效的pts
if(packet.pts == AV_NOPTS_VALUE) {
timestamp = 0;
} else {
timestamp = av_frame_get_best_effort_timestamp(&vFrame)*av_q2d(vStream->time_base);
}
//计算帧率,平均每帧间隔时间
double frameRate = av_q2d(vStream->avg_frame_rate);
frameRate += vFrame.repeat_pict * (frameRate * 0.5);
if (timestamp == 0.0) {
//按照默认帧率播放
usleep((unsigned long)(frameRate*1000));
}else {
if (fabs(timestamp - audioClock) > AV_SYNC_THRESHOLD_MIN &&
fabs(timestamp - audioClock) < AV_NOSYNC_THRESHOLD) {
//如果视频比音频快,延迟差值播放,否则直接播放,这里没有做丢帧处理
if (timestamp > audioClock) {
usleep((unsigned long)((timestamp - audioClock)*1000000));
}
}
}