zoukankan      html  css  js  c++  java
  • 音视频的格式发展趋势

    随着当前计算机技术日新月异的发展趋势,人们之间通过音视频进行通话,通过手机端、PC端观看视频,这样不断有新的音视频编码格式与标准出现。国内领先的音视频开发“AnyChat”产品,是一款专注于音视频的解决方案,他们采用的音视频编解码是目前最为流行的H.264视频编解码技术和AAC音频编解码技术,有兴趣朋友可以进行搜索进行测试试用。现在4K视频越来越火热,下面结合目前流行的音视频编码格式与码率计算做一些简介,介绍电脑上常见的音频格式 。

      (1)PCM编码格式(WAV格式):PCM脉冲编码调制是Pulse Code Modulation的缩写,要算一个PCM音频流的码率是一件很轻松的事情,采样率值采样大小值等于声道数与采样率与采样大小的乘积。一个采样率为44.1kHz,采样大小为16bit,双声道的PCM编码的WAV文件,它的数据速率则为 44.1×16×2=1411.2 kbps。我们常说128K的MP3,对应的WAV参数,就是这个1411.2kbps,这个参数也被称为数据带宽,它和ADSL中的带宽是一个概念。将码率除以8,就可以得到这个WAV的数据速率,即176.4KB/s。这表示存储一秒钟采样率为44.1kHz,采样大小为16bit,双声道的PCM编码的音频信号,需要176.4KB的空间,1分钟则约为10.34M。 由此可知,一个小时的CD格式的音乐需要635MB的存贮空间,一张普通CD片最长的播放时间为74分钟。

      (2)MP1、MP2、MP3格式:MP1和MP2的压缩率分别为4∶1和6∶1~8∶1,而MP3的压缩率则高达10∶1~12∶1。在128kbps的采样频率下编码一首时长1分钟的歌曲,可以得到960KB的MP3文件。采用缺省的CBR(固定采样频率)技术可以以固定的频率采样一首歌曲,而VBR(可变采样频率)则可以在音乐“忙”的时候加大采样频率以获取更高的音质,不过产生的MP3文件在某些播放器上可能无法播放。我们把VBR的音质级别设定成与前面的CBR文件基本一样,生成的VBRMP3文件为990KB。目前网上的MP3大多采用128kbps的采样频率,所以我们可以按MP3文件大小来判断一首歌的长短,如MP3文件大小是3M,那么在采样频率为128kbps情况时,歌曲的时间约为3分钟;或MP3文件大小是4.5M,歌曲的时间约为3分钟,那么我们可以知道这首歌的采样频率为192kbps。一首歌文件越大,采样频率越高,音质就会越好。

       (3)WMA格式:WMA就是Windows Media Audio的缩写,使用微软自己开发的Windows Media Audio技术,这是一种音频压缩格式。WMA是Microsoft Windows Media技术中的一部分,它包含了对音频格式的一个完整的定义,包括编码规范和加密格式。它的加密格式异常强大,甚至可以限制播放机器、播放次数以及播放时间,有着比MP3更好的版权保护性能。还有就是WMA的“流”性能要比MP3好,在音质不高的情况下,相同质量的WMA的流量要比MP3低,微软声称,在只有64kbps码率的情况下,WMA可以达到接近CD的音质。根据相关测评,WMA的最佳码率为64~192kbps,如不在此范围内其音质反而不如相同码率的MP3。AnyChat音视频开发中的录像存储格式就可以采用该格式进行存储。

       (4)MIDI格式:MIDI即电子琴声音,它并不是一段录制好的声音,而是记录声音的信息,然后再告诉声卡如何再现音乐的一组指令。这样,一个MIDI文件每存1分钟的音乐只用大约5~10KB存贮空间。由于文件小,所以适用于在存储空间不大的手机上做和弦铃声。

       (5)DTS、AC-3格式:家庭影院一共有六个音箱,分别是前置左右音箱、后置左右环绕音箱,用来营造身临其景的环绕声场;一个中置音箱,用来强化影片中的对白;还必须配置一个超重低音箱,以感受排山倒海的气势。与音响组合不同的是,家庭影院可以营造出一种身临其境的感觉,这是因为家庭影院具有环绕处理效果。我们下面介绍一下环绕声场5.1多声道系统的两个代表DTS、AC-3的数据情况。采用PCM编码的两声道的CD数据率为2RFs,即1.411Mb/s。使用多声道系统时,左、右、后置左右环绕、及中置音箱各占一个声道的数据,超重低音由于只要表现低音部分而不需要太高的采样所以只占0.1声道的数据,此时的数据率为 5.1×R×Fs=3.598Mb/s。

      DTS跟AC-3的差异在于资料流量的大小,DTS在DVD上拥有1536kbps的资料流量,最大编码流量与LPCM相同,也就是每秒48000×16×2=1536000bit,与 AC-3的码率64kbps~448kbps相比较,足足多了3倍多的资料流量。即使将AC-3拉到极限的640kbps,DTS跟AC-3的流量相比还是强过2倍有余,这使得DTS能较AC-3听到更多的细节,整个空间感及移动感也更加优良、更加清楚。

     视频的大小:一帧全屏幕、全运动、全彩(640×480×24,30fps)的数字影像(包括同步声音)约有27.7MB,十分钟非压缩的数字视频影像约有16. 62GB。 目前流程的视频格式有:

       (1)MPEG-12347格式:MPEG-1即将VCD格式的MPEG数据码率固定在1.15 MBits/s,其视频压缩率为26∶1。使用MPEG-1的压缩算法,可以把一部120分钟长的多媒体流压缩到1.2GB左右大小;MPEG-2(标准代号IOS/IEC13818)于1994年发布国际标准草案(DIS),在视频编码算法上基本和MPEG-1相同,只是有了一些小小的改良;MPEG-3最初为HDTV制定,由于MPEG-2的快速发展,MPEG-3还未彻底完成便宣告淘汰;MPEG-4于1998年公布,和MPEG-2所针对的不同,MPEG-4追求的不是高品质而是高压缩率以及适用于网络的交互能力。MPEG-4提供了非常惊人的压缩率,如果以VCD画质为标准,MPEG-4可以把120分钟的多媒体流压缩至300M;MPEG7适用于图书馆档案查询,压缩比非常高,码率很低。现在常用的声音压缩标准有杜比和AC3两种。

       (2)流媒体格式:宽带高速接入互联网将越来越普及,其中最热门的应用大概就是在网上实时看电影、电视及收听广播了。只能在网络上实时收看的节目,我们一般称其为“流媒体”。目前网上使用的流媒体格式以 RM 和 ASF(MWV)为代表,其中 ASF(MWV)编码格式也是基于MPEG-4的。AnyChat的流媒体技术处于国内领先地位,流媒体的应用将在未来高速网络中越来越广泛。

  • 相关阅读:
    .NET XmlNavigator with Namespace
    编程要素
    【FOJ】1962 新击鼓传花游戏
    【POJ】1389 Area of Simple Polygons
    【POJ】2482 Stars in Your Window
    【HDU】3265 Posters
    【HDU】1199 Color the Ball
    【HDU】3642 Get The Treasury
    【HDU】4027 Can you answer these queries?
    【HDU】1542 Atlantis
  • 原文地址:https://www.cnblogs.com/hsq0421/p/4169229.html
Copyright © 2011-2022 走看看