zoukankan      html  css  js  c++  java
  • WAV文件格式分析

    一. RIFF概念

    在Windows环境下,大部分的多媒体文件都依循着一种结构来存放信息,这样的结构称为"资源互换文件格式"(Resources lnterchange File Format),简称RIFF。比如声音的WAV文件、视频的AV1文件等等均是由此结构衍生出来的。RIFF能够看做是一种树状结构,其基本构成单位为chunk,宛如树状结构中的节点,每一个chunk由"辨别码"、"数据大小"及"数据"所组成。

    块的标志符(4BYTES)

    数据大小 (4BYTES)

    数据

                                   图一、 块的结构示意图

    辨别码由4个ASCII码所构成,数据大小则标示出紧跟其后数据的长度(单位为Byte),而数据大小本身也用掉4个Byte,所以其实一个chunk的长度为数据大小加8。一般而言,chunk本身并不同意内部再包括chunk,但有两种例外,分别为以"RIFF"及"L1ST"为辨别码的chunk。而针对此两种chunk,RIFF又从原先的"数据"中切出4个Byte。 此4个Byte称为"格式辨别码",然而RIFF又规定文件里仅能有一个以"RIFF"为辨别码的chunk。

    RIFF/LIST标志符

    数据1大小

    数据1

    格式/列表类型

    数据

                                   图二、RIFF/LIST块结构

    仅仅要依循此一结构的文件,我们均称之为RIFF档。此种结构提供了一种系统化的分类。假设和MS一DOS文件系统作比較,"RIFF"chunk就好比是一台硬盘的根文件夹,其格式辨别码便是此硬盘的逻辑代码(C:或D:),而"L1ST"chunk即为其下的子文件夹,其它的chunk则为一般的文件。至于在RIFF文件的处理方面,微软提供了相关的函数。视窗下的各种多媒体文件格式就如同在磁盘机下规定仅能放如何的文件夹,而在该文件夹下仅能放何种数据。

    二. WAV文件格式

    WAVE文件是很easy的一种RIFF文件,它的格式类型为"WAVE"。RIFF块包括两个子块,这两个子块的ID各自是"fmt"和"data",当中"fmt"子块由结构PCMWAVEFORMAT所组成,其子块的大小就是sizeofof(PCMWAVEFORMAT),数据组成就是PCMWAVEFORMAT结构中的数据。

    标志符(RIFF)

    数据大小

    格式类型("WAVE")

    "fmt"

    Sizeof(PCMWAVEFORMAT)

    PCMWAVEFORMAT

    "data"

    声音数据大小

    声音数据

    图三、WAVE文件结构

    PCMWAVEFORMAT结构定义例如以下:

    Typedef struct
    ...{
         WAVEFORMAT wf;       
    /
    波形格式;
         WORD wBitsPerSample;   
    //WAVE文件的採样大小;

    }
    PCMWAVEFORMAT;

    //WAVEFORMAT结构定义例如以下:

    typedef struct
    ...{
         WORD wFormatag;       
    //编码格式,包含WAVE_FORMAT_PCM,WAVEFORMAT_ADPCM等

         WORD nChannls;        //声道数,单声道为1,双声道为2;
         DWORD nSamplesPerSec;    //採样频率;
         DWORD nAvgBytesperSec;    //每秒的数据量;
          WORD nBlockAlign;        //块对齐;
    }
    WAVEFORMAT;

    "data"子块包括WAVE文件的数字化波形声音数据,其存放格式依赖于"fmt"子块中wFormatTag成员指定的格式种类,在多声道WAVE文件里,样本是交替出现的。如16bit的单声道WAVE文件和双声道WAVE文件的数据採样格式分别如图四所看到的:

    16位单声道:

    採样一

    採样二

    ……

    低字节

    高字节

    低字节

    高字节

    ……

    16位双声道:

    採样一

    ……

    左声道

    右声道

    ……

    低字节

    高字节

    低字节

    高字节

    ……

                                 图四、WAVE文件数据採样格式

    WAV文件格式实例分析:

    0   1   2   3   4   5   6   7   8   9   A   B   C   D   E   F

    00000000H

    00000010H

    00000020H

    00000030H

    00000040H

    52  49  46  46  0A 06  01  00  57  41  56  45  66  6D 74  20

    12  00  00  00  01  00  02  00  44  AC 00 00  10  B1  02  00

    04  00  10  00  00  00  66  61  63  74  04  00  00  00  76  41

    00  00  64  61  74  61  D8  05  01  00 00  00  00  00  FF  FF

    00  00  FE FF FE FF  00  00  00  00 FE  FF FE FF  00  00

    偏移地址

    字节数

    数据类型

    内容

    文件头

    00H

    4

    char

    “RIFF”;   RIFF标志

    04H

    4

    long int

    0x00 01 06 0A(注意数据存储顺序);   文件长度

    08H

    4

    char

    “WAVE”;   WAVE标志

    0CH

    4

    char

    “fmt ”;   fmt标志,最后一位为空

    10H

    4

    long int

    0x12;   sizeof(PCMWAVEFORMAT)

    14H

    2

    int

    1WAVE_FORMAT_PCM格式类别,1表示为PCM形式的声音数据

    16H

    2

    int

    2;  通道数,单声道为1,双声道为2

    18H

    2

    int

    44100;  採样频率(每秒样本数)

    1CH

    4

    long int

    0x10B10000;   每秒数据量;其值为通道数×每秒数据位数×每样本的数据位数/8。播放软件利用此值能够预计缓冲区的大小。

    20H

    2

    int

    数据块的调整数(按字节算的),其值为通道数×每样本的数据位值/8。播放软件须要一次处理多个该值大小的字节数据,以便将其值用于缓冲区的调整。

    22H

    2

    每样本的数据位数,表示每一个声道中各个样本的数据位数。假设有多个声道,对每一个声道而言,样本大小都一样。

    50H

    4

    char

    “data”;   数据标记符

    54H

    4

    long int

    0x00 01 05 D8;   语音数据大小

  • 相关阅读:
    自考新教材--p78
    自考新教材--p76_2
    自考新教材--p76_1
    自考新教材--p75
    自考新教材--p70
    自考新教材--p69
    以HTML5及其衍生技术为基础的B/S架构实时视频监控解决方案
    智能化安防视频监控行业发展是如何转变的?
    摄像头视频监控是如何与流媒体服务器云平台连接的?
    如何实现摄像头监控数据实时存储及传输?
  • 原文地址:https://www.cnblogs.com/gcczhongduan/p/4049126.html
Copyright © 2011-2022 走看看