本文转自:FFmpeg 入门(7):Seeking | www.samirchen.com
处理 seek 命令
我们将为播放器添加 seek 的能力。这个过程中,我们会看到 av_seek_frame
用起来有多方便。
我们添加的功能是通过上下左右键能够做快进或快退,其中左右键快进或快退的幅度较小,为 10s,上下键快进或快退的幅度较大,为 60s。所以我们需要在我们的事件处理循环中添加处理按键的逻辑。但是当我们遇到按键事件时,我们不能直接调用 av_seek_frame
,我们需要在 decode loop 和 decode_thread loop 进行处理。所以我们需呀在 VideoState
里添加一些变量来记录 seek 的位置以及一些 seek 的标记。
typedef struct VideoState {
// ... code ...
int seek_req;
int seek_flags;
int64_t seek_pos;
// ... code ...
}
我们需要在主函数的事件循环中监听按键事件:
for (;;) {
double incr, pos;
SDL_WaitEvent(&event);
switch (event.type) {
case SDL_KEYDOWN:
switch (event.key.keysym.sym) {
case SDLK_LEFT:
incr = -10.0;
goto do_seek;
case SDLK_RIGHT:
incr = 10.0;
goto do_seek;
case SDLK_UP:
incr = 60.0;
goto do_seek;
case SDLK_DOWN:
incr = -60.0;
goto do_seek;
do_seek:
if (global_video_state) {
pos = get_master_clock(global_video_state);
pos += incr;
stream_seek(global_video_state, (int64_t)(pos * AV_TIME_BASE), incr);
}
break;
default:
break;
}
break;
// ... code ...
}
当我们监听到按键事件并判断出按键方向时,我们就知道了我们该如何 seek 了,这时候我们通过 get_master_clock()
获得此时的时钟值,并加上要 seek 的时间,然后调用 stream_seek()
函数来设置 seek_pos
等值。我们转换新的时间为 avcodec
的内部时间戳单位。记住,在流中时间戳是通过帧数来度量而不是秒,公式是:seconds = frames * time_base (fps)
。avcodec
中 time_base
的默认值是 1000000 fps(也就是说 2s 的位置即时间戳为 2000000)。我们将看到我们为什么要转换这个值。
下面是 stream_seek()
函数,我们设置了一个 flag 来标记是快进还是快退:
void stream_seek(VideoState *is, int64_t pos, int rel) {
if (!is->seek_req) {
is->seek_pos = pos;
is->seek_flags = rel < 0 ? AVSEEK_FLAG_BACKWARD : 0;
is->seek_req = 1;
}
}
现在我们回到 decode_thread()
,我们将在这里做实际的 seek 操作。
我们的 seek 操作是围绕着 av_seek_frame()
函数进行的。这个函数的参数是:AVFormatContext *s, int stream_index, int64_t timestamp, int flags
。这个函数将 seek 到你给它的 timestamp
。timestamp
的单位是你传入的流的 time_base
。但是,你可以不用传入一个流,通过传一个 -1 来表示。如果这样的话,time_base
就会是 avcodec
内部的时间戳单位,即 1000000 fps。这就是为什么我们要在设置 seek_pos
时把 position 乘上 AV_TIME_BASE
的原因。
然而,有时候对于有些媒体文件,你传给 av_seek_frame()
-1 作为 stream_index
可能会遇到一些问题。所以我们将选择文件中的第一个流传给 av_seek_frame()
。不要忘记,这时我们也必须调整我们的时间戳到新的单位。
// Seek stuff goes here.
if (is->seek_req) {
int stream_index= -1;
int64_t seek_target = is->seek_pos;
if (is->videoStream >= 0) {
stream_index = is->videoStream;
} else if (is->audioStream >= 0) {
stream_index = is->audioStream;
}
if (stream_index >= 0){
seek_target= av_rescale_q(seek_target, AV_TIME_BASE_Q, pFormatCtx->streams[stream_index]->time_base);
}
if (av_seek_frame(is->pFormatCtx, stream_index, seek_target, is->seek_flags) < 0) {
fprintf(stderr, "%s: error while seeking
", is->pFormatCtx->filename);
} else {
// ... code ...
}
av_rescale_q(a, b, c)
这个函数可以将一个时间戳从一个基址调整到另一个基址。它只是简单的计算 a * b / c
,但是这个函数是必须的,因为该计算可能溢出。AV_TIME_BASE_Q
是 AV_TIME_BASE
的分数版本,他们完全不同:AV_TIME_BASE * time_in_seconds = avcodec_timestamp
以及 AV_TIME_BASE_Q * avcodec_timestamp = time_in_seconds
。但要注意,AV_TIME_BASE_Q
实际上是一个 AVRational
对象,因此你必须在 avcodec
中使用特殊的 q 函数来处理它。
刷新缓冲区
我们将 seek 调整完毕,但是还没完全完成。我们有一个存放 packet 的队列,既然现在我们 seek 到别的位置了,那么我们就需要刷新一下这个队列,否则视频就没法 seek 了。不光如此,avcodec
也有它内部的缓冲区,也需要由各对应的线程来刷新。
为此,首先,我们需要写一个函数来清理我们的 packet 队列。然后,我们需要有一些机制来告诉音视频线程来刷新 avcodec
的内部缓冲区。我们可以通过在刷新后的 packet 队列中放一个特殊的 packet 来做到这一点,当 avcodec
探测到这个 packet 时,它就会刷新自己的缓冲区。
我们实现的函数是 packet_queue_flush()
,代码如下:
static void packet_queue_flush(PacketQueue *q) {
AVPacketList *pkt, *pkt1;
SDL_LockMutex(q->mutex);
for (pkt = q->first_pkt; pkt != NULL; pkt = pkt1) {
pkt1 = pkt->next;
av_packet_unref(&pkt->pkt);
av_freep(&pkt);
}
q->last_pkt = NULL;
q->first_pkt = NULL;
q->nb_packets = 0;
q->size = 0;
SDL_UnlockMutex(q->mutex);
}
既然现在队列已经刷新,接着就是放一个 flush packet,但是首先我们要定义一下它:
AVPacket flush_pkt;
int main(int argc, char *argv[]) {
// ... code ...
av_init_packet(&flush_pkt);
flush_pkt.data = (unsigned char *) "FLUSH";
// ... code ...
}
现在我们把它放到刷新后的队列中:
// Seek stuff goes here.
if (is->seek_req) {
// ... code ...
} else {
if (is->audioStream >= 0) {
packet_queue_flush(&is->audioq);
packet_queue_put(&is->audioq, &flush_pkt);
}
if (is->videoStream >= 0) {
packet_queue_flush(&is->videoq);
packet_queue_put(&is->videoq, &flush_pkt);
}
}
is->seek_req = 0;
}
上面这段代码在 decode_thread()
中。我们还需要修改一下 packet_queue_put()
函数当是 flush packet 时不做拷贝:
int packet_queue_put(PacketQueue *q, AVPacket *pkt) {
AVPacketList *pkt1;
if (pkt != &flush_pkt && av_packet_ref(pkt, pkt) < 0) {
return -1;
}
// ... code ...
}
接着是修改 audio thread 和 video thread,我们在调用 packet_queue_put()
后即检查 flush packet 并调用 avcodec_flush_buffers()
:
视频线程,在 video_thread()
中:
if (packet_queue_get(&is->videoq, packet, 1) < 0) {
// Means we quit getting packets.
break;
}
if (packet->data == flush_pkt.data) {
avcodec_flush_buffers(is->video_st->codec);
continue;
}
音频线程,在 audio_decode_frame()
中:
// Next packet.
if (packet_queue_get(&is->audioq, pkt, 1) < 0) {
return -1;
}
if (pkt->data == flush_pkt.data) {
avcodec_flush_buffers(is->audio_st->codec);
continue;
}
以上便是我们这节教程的全部内容,其中的完整代码你可以从这里获得:https://github.com/samirchen/TestFFmpeg
编译执行
你可以使用下面的命令编译它:
$ gcc -o tutorial07 tutorial07.c -lavutil -lavformat -lavcodec -lswscale -lz -lm `sdl-config --cflags --libs`
找一个视频文件,你可以这样执行一下试试:
$ tutorial07 myvideofile.mp4