zoukankan      html  css  js  c++  java
  • Flv的结构分析

    Flv是网络上流行的非常广的一种媒体格式,很多大型媒体网站都在使用这种格式承载音视频信息,比如优酷等网站。

       

    Flv文件格式相对而言还是比较简单的,主要是由两部分组成

       

    FLV header

    FLV body

       

       

    FLV header

       

    前9个字节

    46 4c 56 01 05 00 00 00 00 09

    第一到第三字节(46 4c 56) 的ascii的代码为"FLV"(注意大小写)

    第四个字节为版本信息,一般都为(01)

    第五个字节为流的信息,表示是否有视频信息,是否有音频信息。0000 0001(0x01)为有视频,0000 0100(0x04)为有音频,既有有视频又有音频为(0x05)

    第六到第九字节存放的是整个头部长度,一般为(3+1+1+4)=9。

       

    FLV body

       

    Flv body是由很多tag组成,tag又分成三种类型

    • script(脚本流)
    • video(视频流)
    • audio(音频流)

       

    tag的结构举例如下:

       

       

    每个tag包含

    • tag header
    • tag data

         

    tag header

       

    tag header 的第一个字节表示为记录的数据类型,(0x12)为脚本类型;(0x08)为音频类型;(0x09)为视频类型    

    tag header的第二到第四个字节表示为数据区长度

    (0x00 01 74)表示 为372,表示tag data 长度

    tag header 的第五到第七个字节表示为时间戳,类型为(0x12)的tag时间戳一直为0,(0xFFFFFF)可以表示长度为4小时,单位为毫秒。

    tag header 的第八个字节为扩展时间戳,一般都为0,长度为4小时的flv一般很少见了。

    tag header 的第九到第十一个字节为streamID,总为0.

       

    tag data

       

    tag data三种类型的结构表示如下:

    script(脚本流)

    包含两个AMF(Action Message Format)包,第一个AMF包封装了" onMetaData ",第二个AMF包封装了诸如视频图像长宽,文件长度,视频帧率,音频比特率,位深等等。

    第一个字节表示AMF包类型,都是(0x02),表示字符串。

    第二到第三个字节表示字符串长度,一般是(0x0a),表示10个字符串,就是第四到第十三个字节包含的" onMetaData "字符串的长度。

    第十四个字节是第二个AMF包类型,一般是(0x08),表示数组,第十五到第十八个字节是AMF包长度,表示数组元素个数。(0x10)表示包含16个数组元素长度。

    后面即为各数组元素的封装,数组元素为元素名称和值组成的对。表示方法如下:

       

    第1-2个字节表示元素名称的长度,假设为L。

    后面跟着为长度为L的字符串。

    第L+3个字节表示元素值的类型。

    后面跟着为对应值,占用字节数取决于值的类型。

       

       

    video(视频流)

       

    视频流如下:

    前4bits表示类型:

    ·1-- keyframe

    ·2 -- inner frame

    ·3 -- disposable inner frame (h.263 only)

    ·4 -- generated keyframe

    (0x17)前4bit表示为0001,表示为keyframe

       

    后4bits表示解码器ID:

    ·2 -- seronson h.263

    ·3 -- screen video

    ·4 -- On2 VP6

    ·5 -- On2 VP6 with alpha channel

    ·6 -- Screen video version 2

    ·7 -- AVC (h.264)

    (0x17)后4bits表示为0111,表示为avc(h.264)

       

    第二个字节固定为0x01。

     

    之后是视频数据。

       

       

    audio(音频流)

    前4bits表示音频格式:

    ·0 -- 未压缩

    ·1 -- ADPCM

    ·2 -- MP3

    ·4 -- Nellymoser 16-kHz mono

    ·5 -- Nellymoser 8-kHz mono

    ·10 – AAC

    (0x2b)前4bits为2,表示为mp3

       

    下面两个bits表示samplerate:

    ·0 -- 5.5KHz

    ·1 -- 11kHz

    ·2 -- 22kHz

    ·3 -- 44kHz

    (0x2b)中b表示为 1011,10为2,表示22kHz

       

    下面1bit表示采样长度:

    ·0 -- snd8Bit

    ·1 -- snd16Bit

       

       

    下面1bit表示类型:

    ·0 -- sndMomo

    ·1 – sndStereo

       

    之后是数据。

       

    tag size

    在每个tag前面都有四个字节,表示前面tag的长度大小,因为script(脚本流)前面没有tag,所以script tag前面的四个字节都为(0x00 00 00 00).

    相应的入门代码 传送门

  • 相关阅读:
    配置vCenter Server Appliance 6.7
    部署vCenter Server Appliance 6.7
    罗克韦尔 Allen-Bradley MicroLogix 1400 查看、设置IP
    centos7 部署 docker compose
    centos7 部署 docker ce
    docker 定时清理none镜像
    [CLR via C#]5.1 基元类型
    [CLR via C#]4. 类型基础及类型、对象、栈和堆运行时的相互联系
    [CLR via C#]1.6 Framework类库~1.9与非托管代码的互操作性
    [CLR via C#]1.5 本地代码生成器:NGen.exe
  • 原文地址:https://www.cnblogs.com/poissonnotes/p/7744283.html
Copyright © 2011-2022 走看看