zoukankan      html  css  js  c++  java
  • 【秒懂音视频开发】10_PCM转WAV

    播放器是无法直接播放PCM的,因为播放器并不知道PCM的采样率、声道数、位深度等参数。当PCM转成某种特定的音频文件格式后(比如转成WAV),就能够被播放器识别播放了。

    本文通过2种方式(命令行、编程)演示一下:如何将PCM转成WAV。

    WAV文件格式

    在进行PCM转WAV之前,先再来认识一下WAV的文件格式

    • WAV、AVI文件都是基于RIFF标准的文件格式
    • RIFF(Resource Interchange File Format,资源交换文件格式)由Microsoft和IBM提出
    • 所以WAV、AVI文件的最前面4个字节都是RIFF四个字符

    找遍了全网,并没有找到令我十分满意的WAV文件格式图,于是按照自己的理解画了一张表格,个人觉得还是极其通俗易懂的。

    WAV文件格式

    每一个chunk(数据块)都由3部分组成:

    • id:chunk的标识
    • data size:chunk的数据部分大小,字节为单位
    • data,chunk的数据部分

    整个WAV文件是一个RIFF chunk,它的data由3部分组成:

    • format:文件类型
    • fmt chunk
      • 音频参数相关的chunk
      • 它的data里面有采样率、声道数、位深度等参数信息
    • data chunk
      • 音频数据相关的chunk
      • 它的data就是真正的音频数据(比如PCM数据)

    RIFF chunk除去data chunk的data(音频数据)后,剩下的内容可以称为:WAV文件头,一般是44字节。

    命令行

    通过下面的命令可以将PCM转成WAV。

    ffmpeg -ar 44100 -ac 2 -f s16le -i out.pcm out.wav
    

    需要注意的是:上面命令生成的WAV文件头有78字节。对比44字节的文件头,它多增加了一个34字节大小的LIST chunk。

    关于LIST chunk的参考资料:

    加上一个输出文件参数-bitexact可以去掉LIST Chunk。

    ffmpeg -ar 44100 -ac 2 -f s16le -i out.pcm -bitexact out2.wav
    

    编程

    在PCM数据的前面插入一个44字节的WAV文件头,就可以将PCM转成WAV。

    WAV的文件头结构

    WAV的文件头结构大概如下所示:

    #define AUDIO_FORMAT_PCM 1
    #define AUDIO_FORMAT_FLOAT 3
    
    // WAV文件头(44字节)
    typedef struct {
        // RIFF chunk的id
        uint8_t riffChunkId[4] = {'R', 'I', 'F', 'F'};
        // RIFF chunk的data大小,即文件总长度减去8字节
        uint32_t riffChunkDataSize;
    
        // "WAVE"
        uint8_t format[4] = {'W', 'A', 'V', 'E'};
    
        /* fmt chunk */
        // fmt chunk的id
        uint8_t fmtChunkId[4] = {'f', 'm', 't', ' '};
        // fmt chunk的data大小:存储PCM数据时,是16
        uint32_t fmtChunkDataSize = 16;
        // 音频编码,1表示PCM,3表示Floating Point
        uint16_t audioFormat = AUDIO_FORMAT_PCM;
        // 声道数
        uint16_t numChannels;
        // 采样率
        uint32_t sampleRate;
        // 字节率 = sampleRate * blockAlign
        uint32_t byteRate;
        // 一个样本的字节数 = bitsPerSample * numChannels >> 3
        uint16_t blockAlign;
        // 位深度
        uint16_t bitsPerSample;
    
        /* data chunk */
        // data chunk的id
        uint8_t dataChunkId[4] = {'d', 'a', 't', 'a'};
        // data chunk的data大小:音频数据的总长度,即文件总长度减去文件头的长度(一般是44)
        uint32_t dataChunkDataSize;
    } WAVHeader;
    

    PCM转WAV核心实现

    封装到了FFmpegs类的pcm2wav函数中。

    #include <QFile>
    #include <QDebug>
    
    class FFmpegs {
    public:
        FFmpegs();
        static void pcm2wav(WAVHeader &header,
                            const char *pcmFilename,
                            const char *wavFilename);
    };
    
    void FFmpegs::pcm2wav(WAVHeader &header,
                          const char *pcmFilename,
                          const char *wavFilename) {
        header.blockAlign = header.bitsPerSample * header.numChannels >> 3;
        header.byteRate = header.sampleRate * header.blockAlign;
    
        // 打开pcm文件
        QFile pcmFile(pcmFilename);
        if (!pcmFile.open(QFile::ReadOnly)) {
            qDebug() << "文件打开失败" << pcmFilename;
            return;
        }
        header.dataChunkDataSize = pcmFile.size();
        header.riffChunkDataSize = header.dataChunkDataSize
                                   + sizeof (WAVHeader) - 8;
    
        // 打开wav文件
        QFile wavFile(wavFilename);
        if (!wavFile.open(QFile::WriteOnly)) {
            qDebug() << "文件打开失败" << wavFilename;
    
            pcmFile.close();
            return;
        }
    
        // 写入头部
        wavFile.write((const char *) &header, sizeof (WAVHeader));
    
        // 写入pcm数据
        char buf[1024];
        int size;
        while ((size = pcmFile.read(buf, sizeof (buf))) > 0) {
            wavFile.write(buf, size);
        }
    
        // 关闭文件
        pcmFile.close();
        wavFile.close();
    }
    

    调用函数

    // 封装WAV的头部
    WAVHeader header;
    header.numChannels = 2;
    header.sampleRate = 44100;
    header.bitsPerSample = 16;
    
    // 调用函数
    FFmpegs::pcm2wav(header, "F:/in.pcm", "F:/out.wav");
    
  • 相关阅读:
    poj3905 2sat!
    poj3648,2-sat求解
    poj2723 2sat判断解+二分
    hdu3622 2-sat问题,二分+判断有无解即可。
    poj2767,单向连通图判定,缩点+重新建图+新图DFS
    poj2186 求有向图G中所有点都能到达的点的数量
    poj2553 有向图缩点,强连通分量。
    poj 1236+hdu2767 有向图 缩点+看度数(tarjan)
    poj3694+hdu2460 求桥+缩点+LCA/tarjan
    dfs + 最小公倍数 Codeforces Round #383 (Div. 2)
  • 原文地址:https://www.cnblogs.com/mjios/p/14582270.html
Copyright © 2011-2022 走看看