zoukankan      html  css  js  c++  java
  • 多媒体开发基础概念介绍

    介绍

    视频格式可以分为适合本地播放的本地影像视频和适合在网络中播放的网络流媒体影像视频两大类。尽管后者在播放的稳定性和播放画面质量上可能没有前者优秀,但网络流媒体影像视频的广泛传播性使之正被广泛应用于视频点播、网络演示、远程教育、网络视频广告等等互联网信息服务领域。

    注:原始的视频数据可以理解为通过摄像头等驱动获取的没有经过编码的数据,市面上 usb 摄像头输出格式常见的 有:RGB24、YUV2、YV2(这些都是没有编码的原始数据),MJPEG(经过编码的数据)。摄像头捕捉的数据也是 可以设置的,比如 windows 下用 cap 来设置

    视频格式介绍

    MPEG/MPG/DAT
    MPEG(运动图像专家组)是 Motion Picture Experts Group 的缩写。这类格式包括了 MPEG-1,MPEG-2 和 MPEG-4 在内的多种视频格式。MPEG-1 相信是大家接触得最多的了,因为其正在被广泛地应用在 VCD 的制作和一些视频 片段下载的网络应用上面,大部分的 VCD 都是用 MPEG1 格式压缩的( 刻录软件自动将 MPEG1 转换为 DAT 格 式 ) ,使用 MPEG-1 的压缩算法,可以把一部 120 分钟长的电影压缩到 1.2 GB 左右大小。MPEG-2 则是应用在 DVD 的制作,同时在一些 HDTV(高清晰电视广播)和一些高要求视频编辑、处理上面也有相当多的应用。使用 MPEG-2 的压缩算法压缩一部 120 分钟长的电影可以压缩到 5-8 GB 的大小(MPEG2 的图像质量是 MPEG-1 无法 比拟的)。MPEG 系列标准已成为国际上影响最大的多媒体技术标准,其中 MPEG-1 和 MPEG-2 是采用相同原理为 基础的预测编码、变换编码、熵编码及运动补偿等第一代数据压缩编码技术;MPEG-4(ISO/IEC 14496)则是基于 第二代压缩编码技术制定的国际标准,它以视听媒体对象为基本单元,采用基于内容的压缩编码,以实现数字视音 频、图形合成应用及交互式多媒体的集成。MPEG 系列标准对 VCD、DVD 等视听消费电子及数字电视和高清晰度 电视(DTV&&HDTV)、多媒体通信等信息产业的发展产生了巨大而深远的影响。

    AVI
    AVI,音频视频交错(Audio Video Interleaved)的英文缩写。AVI 这个由微软公司发表的视频格式,在视频领域 可以说是最悠久的格式之一。AVI 格式调用方便、图像质量好,压缩标准可任意选择,是应用最广泛、也是应用时 间最长的格式之一。

    MOV
    使用过 Mac 机的朋友应该多少接触过 QuickTime。QuickTime 原本是 Apple 公司用于 Mac 计算机上的一种图像 视频处理软件。Quick-Time 提供了两种标准图像和数字视频格式, 即可以支持静态的.PIC 和.JPG 图像格式,动态的基于 Indeo 压缩法的.MOV 和基于 MPEG 压缩法的.MPG 视频格式。

    ASF
    ASF(Advanced Streaming format 高级流格式)。ASF 是 MICROSOFT 为了和的 Real player 竞争而发展出来的一 种可以直接在网上观看视频节目的文件压缩格式。ASF 使用了 MPEG4 的压缩算法,压缩率和图像的质量都很不错。 因为 ASF 是以一个可以在网上即时观赏的视频“流”格式存在的,所以它的图像质量比 VCD 差一点点并不出奇,但比同是视频“流”格式的 RAM 格式要好。

    WMV
    一种独立于编码方式的在 Internet 上实时传播多媒体的技术标准,Microsoft 公司希望用其取代 QuickTime 之类 的技术标准以及 WAV、AVI 之类的文件扩展名。WMV 的主要优点在于:可扩充的媒体类型、本地或网络回放、 可伸缩的媒体类型、流的优先级化、多语言支持、扩展性等。

    NAVI
    如果发现原来的播放软件突然打不开此类格式的 AVI 文件,那你就要考虑是不是碰到了 n AVI。n AVI 是 New AVI 的缩写,是一个名为 Shadow Realm 的地下组织发展起来的一种新视频格式。它是由 Microsoft ASF 压缩算法 的修改而来的(并不是想象中的 AVI),视频格式追求的无非是压缩率和图像质量,所以 NAVI 为了追求这个目标,改善了原始的 ASF 格式的一些不足,让 NAVI 可以拥有更高的帧率。可以这样说,NAVI 是一种去掉视频流 特性的改良型 ASF格式。

    3GP
    3GP 是一种 3G 流媒体的视频编码格式,主要是为了配合 3G 网络的高传输速度而开发的,也是目前手机中最 为常见的一种视频格式。 简单的说,该格式是“第三代合作伙伴项目”(3GPP)制定的一种多媒体标准,使用户能使用手机享受高质量的视频、 音频等多媒体内容。其核心由包括高级音频编码(AAC)、自适应多速率 (AMR) 和 MPEG-4 和 H.263 视频编码解码 器等组成,目前大部分支持视频拍摄的手机都支持 3GPP 格式的视频播放。其特点是网速占用较少,但画质较差。

    REAL VIDEO
    REAL VIDEO(RA、RAM)格式由一开始就是定位在视频流应用方面的,也可以说是视频流技术的始创者。 它可以在用 56K MODEM 拨号上网的条件实现不间断的视频播放,当然,其图像质量和 MPEG2、DIVX 等比是不 敢恭维的啦。毕竟要实现在网上传输不间断的视频是需要很大的频宽的,这方面是 ASF 的有力竞争者。

    MKV
    一种后缀为 MKV 的视频文件频频出现在网络上,它可在一个文件中集成多条不同类型的音轨和字幕轨,而且 其视频编码的自由度也非常大,可以是常见的 DivX、XviD、3IVX,甚至可以是 RealVideo、QuickTime、WMV 这 类流式视频。实际上,它是一种全称为 Matroska 的新型多媒体封装格式,这种先进的、开放的封装格式已经给我们 展示出非常好的应用前景。

    FLV
    FLV 是 FLASH VIDEO 的简称,FLV 流媒体格式是一种新的视频格式。由于它形成的文件极小、加载速度极快, 使得网络观看视频文件成为可能,它的出现有效地解决了视频文件导入 Flash 后,使导出的 SWF 文件体积庞大,不 能在网络上很好的使用等缺点。

    F4V
    作为一种更小更清晰,更利于在网络传播的格式,F4V 已经逐渐取代了传统 FLV,也已经被大多数主流播放器 兼容播放,而不需要通过转换等复杂的方式。F4V是Adobe公司为了迎接高清时代而推出继FLV格式后的支持H.264 的 F4V 流媒体格式。它和 FLV 主要的区别在于,FLV 格式采用的是 H263 编码,而 F4V 则支持 H.264 编码的高清 晰视频,码率最高可达 50Mbps。也就是说 F4V 和 FLV 在同等体积的前提下,能够实现更高的分辨率,并支持更高 比特率,就是我们所说的更清晰更流畅。另外,很多主流媒体网站上下载的 F4V 文件后缀却为 FLV,这是 F4V 格 式的另一个特点,属正常现象,观看时可明显感觉到这种实为 F4V 的 FLV 有明显更高的清晰度和流畅度。

    RMVB
    RMVB 的前身为 RM 格式,它们是 Real Networks 公司所制定的音频视频压缩规范,根据不同的网络传输速率, 而制定出不同的压缩比率,从而实现在低速率的网络上进行影像数据实时传送和播放,具有体积小,画质也还不错的优点。
    早期的 RM 格式为了能够实现在有限带宽的情况下,进行视频在线播放而被研发出来,并一度红遍整个互联网。 而为了实现更优化的体积与画面质量,Real Networks 公司不久又在 RM 的基础上,推出了可变比特率编码的 RMVB 格式。RMVB 的诞生,打破了原先 RM 格式那种平均压缩采样的方式,在保证平均压缩比的基础上,采用浮动比特 率编码的方式,将较高的比特率用于复杂的动态画面(如歌舞、飞车、战争等),而在静态画面中则灵活地转为较 低的采样率,从而合理地利用了比特率资源,使 RMVB 最大限度地压缩了影片的大小,最终拥有了近乎完美的接 近于 DVD 品质的视听效果。我们可以做个简单对比,一般而言一部 120 分钟的 dvd 体积为 4GB,而 rmvb 格式来 压缩,仅 400MB 左右,而且清晰度流畅度并不比原 DVD 差太远。
    人们为了缩短视频文件在网络进行传播的下载时间,为了节约用户电脑硬盘宝贵的空间容量,已越来越多的视 频被压制成了 RMVB 格式,并广为流传。到如今,可能每一位电脑使用者(或许就包括正在阅读这篇文章的您) 电脑中的视频文件,超过 80%都会是 RMVB 格式。
    RMVB 由于本身的优势,成为目前 PC 中最广泛存在的视频格式,但在 MP4 播放器中,RMVB 格式却长期得 不到重视。MP4 发展的整整七个年头里,虽然早就可以做到完美支持 AVI 格式,但却久久未有能够完全兼容 RMVB 格式的机型诞生。对于 MP4,尤其是容量小价格便宜的闪存 MP4 而言,怎样的视频格式才将会是其未来的主流呢? 我们不妨来探讨一番。

    WebM
    由 Google 提出,是一个开放、免费的媒体文件格式。WebM 影片格式其实是以 Matroska(即 MKV)容器格 式为基础开发的新容器格式,里面包括了 VP8 影片轨和 Ogg Vorbis 音轨,其中 Google 将其拥有的 VP8 视频编码 技术以类似 BSD 授权开源,Ogg Vorbis 本来就是开放格式。 WebM 标准的网络视频更加偏向于开源并且是基于 HTML5 标准的,WebM 项目旨在为对每个人都开放的网络开发高质量、开放的视频格式,其重点是解决视频服务 这一核心的网络用户体验。Google 说 WebM 的格式相当有效率,应该可以在 netbook、tablet、手持式装置等上面 顺畅地使用。 Ogg Vorbis 本来就是开放格式,大家应该都知道,至于 VP8 则是 Google 当年买下一间叫 On2 的公司的时 候,取得的 Video Codec, Google 也把这个 Codec 以类似 BSD 授权放出来,因此 WebM 应该是不会有 H.264 的那些潜在的专利问题。 Youtube 也会支持 WebM 的播放。来自产业界的有 Adobe -- Flash Player 将会支持 WebM 格式的播放 -- AMD、 ARM、Broadcom、Freescale、NVIDIA、Qualcomm、TI 等。谁不在上头?Intel。在 Browser 方面,Chrome 不要 说,Firefox、Opera 都已经表态将会支持这个新格式。微软 IE9 的支持就没这么直接,出厂时仅会支持 H.264 影 片的播放,但如果你另外下载并安装了 VP8,那当然你也可以播放 HTML / VP8 的影片。 要推动一个新格式进 入主流,甚至成为龙头老大,是非常不容易的。但 WebM 和 VP8 的推动者是 Google,而且是在 H.264 正因为其 非开放性而备受质疑的时候,或许 WebM 真有机会迅速地站稳脚跟,一举成为新一代的影片通用格式呢!

    音频格式介绍

    音频格式是指要在计算机内播放或是处理音频文件,也就是要对声音文件进行数、模转换,这个过程同样由采 样和量化构成,人耳所能听到的声音,最低的频率是从 20Hz 起一直到最高频率 20KHZ,20KHz 以上人耳是听不到 的,因此音频文件格式的最大带宽是 20KHZ,故而采样速率需要介于 40~50KHZ 之间,而且对每个样本需要更多的 量化比特数。音频数字化的标准是每个样本 16 位-96dB 的信噪比,采用线性脉冲编码调制 PCM,每一量化步长都 具有相等的长度。在音频文件的制作中,正是采用这一标准。

    常见的音频格式有:CD 格式、WAVE(*.WAV)、 AIFF、AU、MP3、MIDI、WMA、RealAudio、VQF、OggVorbis、 AAC、APE。

    CD
    CD 格式的音质是比较高的音频格式。因此要讲音频格式,CD 自然是打头阵的先锋。在大多数播放软件的“打 开文件类型”中,都可以看到.cda 格式,这就是 CD 音轨了。标准 CD 格式也就是 44.1K 的采样频率,速率 88K/ 秒,16 位量化位数,因为 CD 音轨可以说是近似无损的,因此它的声音基本上是忠于原声的,因此如果你是一个音 响发烧友的话,CD 是你的首选。它会让你感受到天籁之音。CD 光盘可以在 CD 唱机中播放,也能用电脑里的各种 播放软件来重放。一个 CD 音频文件是一个.cda 文件,这只是一个索引信息,并不是真正的包含声音信息,所以不 论 CD 音乐的长短,在电脑上看到的“.cda 文件”都是 44 字节长。注意:不能直接的复制 CD 格式的.cda 文件到 硬盘上播放,需要使用象 EAC 这样的抓音轨软件把 CD 格式的文件转换成 WAV,这个转换过程如果光盘驱动器质 量过关而且 EAC 的参数设置得当的话,可以说是基本上无损抓音频。推荐大家使用这种方法。

    WAVE

    WAVE(.WAV)是微软公司开发的一种声音文件格式,它符合 PIFFResource Interchange File Format 文件规范, 用于保存 WINDOWS 平台的音频信息资源,被 WINDOWS 平台及其应用程序所支持。“.WAV”格式支持 MSADPCM、CCITT A LAW 等多种压缩算法,支持多种音频位数、采样频率和声道,标准格式的 WAV 文件和 CD 格式一样,也是 44.1K 的采样频率,速率 88K/秒,16 位量化位数,看到了吧,WAV 格式的声音文件质量和 CD 相 差无几,也是目前 PC 机上广为流行的声音文件格式,几乎所有的音频编辑软件都“认识”WAV 格式。

    AIFF
    AIFF(Audio Interchange File Format)格式和 AU 格式,它们都和 WAV 非常相像,在大多数的音频编辑软件中 也都支持它们这几种常见的音乐格式。

    AIFF 是音频交换文件格式的英文缩写。是 APPLE 公司开发的一种音频文件格式,被 MACINTOSH 平台及其应 用程序所支持,NETSCAPE 浏览器中 LIVEAUDIO 也支持 AIFF 格式。所以大家都不常见。AIFF 是 Apple 苹果电脑 上面的标准音频格式,属于 QuickTime 技术的一部分。这一格式的特点就是格式本身与数据的意义无关,因此受到 了 Microsoft 的青睐,并据此搞出来 WAV 格式。AIFF 虽然是一种很优秀的文件格式,但由于它是苹果电脑上的格 式,因此在 PC 平台上并没有得到很大的流行。不过由于 Apple 电脑多用于多媒体制作出版行业,因此几乎所有的 音频编辑软件和播放软件都或多或少地支持 AIFF 格式。只要苹果电脑还在,AIFF 就始终还占有一席之地。由于 AIFF 的包容特性,所以它支持许多压缩技术。

    AU
    AUDIO 文件是 SUN 公司推出的一种数字音频格式。AU 文件原先是 UNIX 操作系统下的数字声音文件。由于 早期 INTERNET 上的 WEB 服务器主要是基于 UNIX 的,所以,AU 格式的文件在如今的 INTERNET 中也是常用的 声音文件格式。

    MPEG

    MPEG 是动态图象专家组的英文缩写。这个专家组始建于 1988 年,专门负责为 CD 建立视频和音频压缩标准。 MPEG 音频文件指的是 MPEG 标准中的声音部分即 MPEG 音频层。目前 INTERNET 上的音乐格式以 MP3 最为常 见。虽然它是一种有损压缩,但是它的最大优势是以极小的声音失真换来了较高的压缩比。MPEG 含有格式包括: MPEG-1、MPEG-2、MPEG-Layer3、MPEG-4

    MP3
    MP3 格式诞生于八十年代的德国,所谓的 MP3 也就是指的是 MPEG 标准中的音频部分,也就是 MPEG 音频层。 根据压缩质量和编码处理的不同分为 3 层,分别对应“.mp1"/“.mp2”/“.mp3”这 3 种声音文件。需要提醒大 家注意的地方是:MPEG 音频文件的压缩是一种有损压缩,MPEG3 音频编码具有 10:1~12:1 的高压缩率,同时 基本保持低音频部分不失真,但是牺牲了声音文件中 12KHz 到 16KHz 高音频这部分的质量来换取文件的尺寸,相同长度的音乐文件,用.mp3 格式来储存,一般只有.wav 文件的 1/10,而音质要次于 CD 格式或 WAV 格式的声音 文件。由于其文件尺寸小,音质好;所以在它问世之初还没有什么别的音频格式可以与之匹敌,因而为.mp3 格式 的发展提供了良好的条件。直到现在,这种格式还是风靡一时,作为主流音频格式的地位难以被撼动。但是树大招 风,MP3 音乐的版权问题也一直是找不到办法解决,因为 MP3 没有版权保护技术,说白了也就是谁都可以用。

    MP3 格式压缩音乐的采样频率有很多种,可以用 64Kbps 或更低的采样频率节省空间,也可以用 320Kbps 的标 准达到极高的音质。用装有 Fraunhofer IIS Mpeg Lyaer3 的 MP3 编码器(现在效果最好的编码器)MusicMatch Jukebox 6.0 在 128Kbps 的频率下编码一首 3 分钟的歌曲,得到 2.82MB 的 MP3 文件。采用缺省的 CBR(固定采样频率)技 术可以以固定的频率采样一首歌曲,而 VBR(可变采样频率)则可以在音乐“忙”的时候加大采样的频率获取更高 的音质,不过产生的 MP3 文件可能在某些播放器上无法播放。把 VBR 的级别设定成为与前面的 CBR 文件的音质 基本一样,生成的 VBR MP3 文件为 2.9MB。

    MP3 是到 2008 年止使用用户最多的有损压缩数字音频格式了。它的全称是 MPEG(MPEG: MovingPictureExpertsGroup)AudioLayer-3,刚出现时它的编码技术并不完善,它更像一个编码标准框架,留待人们 去完善。早期的 MP3 编码采用的的是固定编码率的方式(CBR),看到的 128KBPS,就是代表它是以 128KBPS 固 定数据速率编码——你可以提高这个编码率,最高可以到 320KBPS,音质会更好,自然,文件的体积会相应增大。

    因为 MP3 的编码方式是开放的,可以在这个标准框架的基础上自己选择不同的声学原理进行压缩处理,所以, 很快由 Xing 公司推出可变编码率的压缩方式(VBR)。它的原理就是利用将一首歌的复杂部分用高 bitrate 编码,简单部分用低 bitrate 编码,通过这种方式,进一步取得质量和体积的统一。当然,早期的 Xing 编码器的 VBR 算法很 差,音质与 CBR(固定码率)相去甚远。但是,这种算法指明了一种方向,其他开发者纷纷推出自己的 VBR 算法, 使得效果一直在改进。目前公认比较好的首推 LAME,它完美地实现了 VBR 算法,而且它是是完全免费的软件, 并且由爱好者组成的开发团队一直在不断的发展完善。 而在 VBR 的基础上,LAME 更加发展出 ABR 算法。ABR(AverageBitrate)平均比特率,是 VBR 的一种插值 参数。LAME 针对 CBR 不佳的文件体积比和 VBR 生成文件大小不定的特点独创了这种编码模式。ABR 在指定的 文件大小内,以每 50 帧(30 帧约 1 秒)为一段,低频和不敏感频率使用相对低的流量,高频和大动态表现时使用 高流量,可以做为 VBR 和 CBR 的一种折衷选择。

    MP3 问世不久,就凭这较高的压缩比 12:1 和较好的音质创造了一个全新的音乐领域,然而 MP3 的开放性却最 终不可避免的导致了版权之争,在这样的背景之下,文件更小,音质更佳,同时还能有效保护版权的 MP4 就应运 而生了。MP3 和 MP4 之间其实并没有必然的联系,首先 MP3 是一种音频压缩的国际技术标准,而 MP4 却是一个 商标的名称。

    MPEG-4
    MPEG-4 标准是由国际运动图像专家组于 2000 年 10 月公布的一种面向多媒体应用的视频压缩标准。它采用了 基于对象的压缩编码技术,在编码前首先对视频序列进行分析,从原始图像中分割出各个视频对象,然后再分别对 每个视频对象的形状信息、运动信息、纹理信息单独编码,并通过比 MPEG-2 更优的运动预测和运动补偿来去除连 续帧之间的时间冗余。其核心是基于内容的尺度可变性(Content-basedscalability),可以对图像中各个对象分配优先 级,对比较重要的对象用高的空间和时间分辨率表示,对不甚重要的对象(如监控系统的背景)以较低的分辨率表示, 甚至不显示。因此它具有自适应调配资源能力,可以实现高质量低速率的图像通信和视频传输。 MPEG-4 以其高质 量、低传输速率等优点已经被广泛应用到网络多媒体、视频会议和多媒体监控等图像传输系统中。中国内外大部分 成熟的 MPEG-4 应用均为基于 PC 层面的客户端和服务器模式,应用在嵌入式系统上的并不多,且多数嵌入式 MPEG-4 解码系统大多使用商业的嵌入式操作系统,如 WindowsCE、VxWorks 等,成本高、灵活性差。如以嵌入式 Linux 作为操作系统不仅开发方便,且可以节约成本,并可以根据实际情况进行裁减,占用资源少、灵活性强,网 络性能好,适用范围更广。

    MIDI
    MIDI(Musical Instrument Digital Interface)格式被经常玩音乐的人使用,MIDI 允许数字合成器和其他设备交 换数据。MID 文件格式由 MIDI 继承而来。MID 文件并不是一段录制好的声音,而是记录声音的信息,然后在告诉 声卡如何再现音乐的一组指令。这样一个 MIDI 文件每存 1 分钟的音乐只用大约 5~10KB。MID 文件主要用于原始 乐器作品,流行歌曲的业余表演,游戏音轨以及电子贺卡等。.mid 文件重放的效果完全依赖声卡的档次。.mid 格 式的最大用处是在电脑作曲领域。.mid 文件可以用作曲软件写出,也可以通过声卡的 MIDI 口把外接音序器演奏的 乐曲输入电脑里,制成.mid 文件。

    WMA
    WMA (Windows Media Audio) 格式是来自于微软的重量级选手,后台强硬,音质要强于 MP3 格式,更远胜于 RA 格式,它和日本 YAMAHA 公司开发的 VQF 格式一样,是以减少数据流量但保持音质的方法来达到比 MP3 压 缩率更高的目的,WMA 的压缩率一般都可以达到 1:18 左右,WMA 的另一个优点是内容提供商可以通过 DRM (Digital Rights Management)方案如 Windows Media Rights Manager 7 加入防拷贝保护。这种内置了版权保护技术 可以限制播放时间和播放次数甚至于播放的机器等等,这对被盗版搅得焦头乱额的音乐公司来说可是一个福音,另 外 WMA 还支持音频流(Stream)技术,适合在网络上在线播放,作为微软抢占网络音乐的开路先锋可以说是技术领 先、风头强劲,更方便的是不用象 MP3 那样需要安装额外的播放器,而 Windows 操作系统和 Windows Media Player 的无缝捆绑让你只要安装了 windows 操作系统就可以直接播放 WMA 音乐,新版本的 Windows Media Player7.0 更是 增加了直接把 CD 光盘转换为 WMA 声音格式的功能,在新出品的操作系统 Windows XP 中,WMA 是默认的编码 格式,大家知道 Netscape 的遭遇,现在“狼”又来了。WMA 这种格式在录制时可以对音质进行调节。同一格式, 音质好的可与 CD 媲美,压缩率较高的可用于网络广播。虽然现在网络上还不是很流行,但是在微软的大规模推广 下已经是得到了越来越多站点的承认和大力支持,在网络音乐领域中直逼*.mp3,在网络广播方面,也正在瓜分 Real 打下的天下。因此,几乎所有的音频格式都感受到了 WMA 格式的压力。

    微软官方宣布的资料中称 WMA 格式的可保护性极强,甚至可以限定播放机器、播放时间及播放次数,具有相 当的版权保护能力。应该说,WMA 的推出,就是针对 MP3 没有版权限制的缺点而来——普通用户可能很欢迎这种 格式,但作为版权拥有者的唱片公司来说,它们更喜欢难以复制拷贝的音乐压缩技术,而微软的 WMA 则照顾到了 这些唱片公司的需求。 除了版权保护外,WMA 还在压缩比上进行了深化,它的目标是在相同音质条件下文件体积可以变的更小(当 然,只在 MP3 低于 192KBPS 码率的情况下有效,实际上当采用 LAME 算法压缩 MP3 格式时,高于 192KBPS 时普 遍的反映是 MP3 的音质要好于 WMA)。

    RealAudio
    RealAudio 主要适用于在网络上的在线音乐欣赏,现在大多数的用户仍然在使用 56Kbps 或更低速率的 Modem,所以典型的回放并非最好的音质。有的下载站点会提示你根据你的 Modem 速率选择最佳的 Real 文件。real 的的文 件格式主要有这么几种:有 RA(RealAudio)、 RM(RealMedia,RealAudio G2)、 RMX(RealAudio Secured),还有 更多。这些格式的特点是可以随网络带宽的不同而改变声音的质量,在保证大多数人听到流畅声音的前提下,令带宽较富裕的听众获得较好的音质。

    近来随着网络带宽的普遍改善,Real 公司正推出用于网络广播的、达到 CD 音质的格式。如果你的 RealPlayer 软件不能处理这种格式,它就会提醒你下载一个免费的升级包。许多音乐网站 提供了歌曲的 Real 格式的试听版本。 现在最新的版本是 RealPlayer 9.0,第 39 期《电脑报》也对 RealPlayer 9.0 作了详细的介绍,这里不再赘述。

    VQF
    雅马哈公司另一种格式是.vqf,它的核心是减少数据流量但保持音质的方法来达到更高的压缩比,VQF 的音频 压缩率比标准的 MPEG 音频压缩率高出近一倍,可以达到 18:1 左右甚至更高。也就是说把一首 4 分钟的歌曲(WAV 文件)压成 MP3,大约需要 4MB 左右的硬盘空间,而同一首歌曲,如果使用 VQF 音频压缩技术的话,那只需要 2MB 左右的硬盘空间。因此,在音频压缩率方面,MP3 和 RA 都不是 VQF 的对手。相同情况下压缩后 VQF 的文件 体积比 MP3 小 30%~50%,更便利于网上传播,同时音质极佳,接近 CD 音质(16 位 44.1kHz 立体声)。可以说技术 上也是很先进的,但是由于宣传不力,这种格式难有用武之地。.vqf 可以用雅马哈的播放器播放。同时雅马哈也提 供从.wav 文件转换到.vqf 文件的软件。 此文件缺少特点外加缺乏宣传。

    当VQF以44KHz、80kbit/s的音频采样率压缩音乐时,它的音质优于44KHz、128kbit/s的MP3,当 VQF以44KHz、 96kbit/s 的频率压缩时,它的音质几乎等于 44KHz、256kbit/s 的 MP3。经 SoundVQ 压缩后的音频文件在进行回放效 果试听时,几乎没有人能听出它与原音频文件的差异。

    VQF 音频文件个格式

    播放 VQF 对计算机的配置要求仅为奔腾 75 或更高,当然如果您用奔腾 100 或以上的机器,VQF 能够运行得更 加出色。实际上,播放 VQF 对 CPU 的要求仅比 Mp3 高 5~10%左右。 VQF 即 TwinVQ 技术虽然是由 NTT 和 YAMAHA 开发的,但它们的应用软件都是免费的。只是 NTT 和 YAMAHA 并没有公布 VQF 的源代码。

    OggVorbis

    OggVorbis 是一种新的音频压缩格式,类似于 MP3 等现有的音乐格式。但有一点不同的是,它是完全免费、开放和没有专利限制的。Vorbis 是这种音频压缩机制的名字,而 Ogg 则是一个计划的名字,该计划意图设计一个完全 开放性的多媒体系统。目前该计划只实现了 OggVorbis 这一部分。 OggVorbis 文件的扩展名是*.OGG。这种文件的设计格式是非常先进的。这种文件格式可以不断地进行大小和 音质的改良,而不影响旧有的编码器或播放器。

    VORBIS 采用有损压缩,但通过使用更加先进的声学模型去减少损失,因此,同样位速率(BitRate)编码的 OGG 与 MP3 相比听起来更好一些。另外,还有一个原因,MP3 格式是受专利保护的。如果你想使用 MP3 格式发布自己 的作品,则需要付给 Fraunhofer(发明 MP3 的公司)专利使用费。而 VORBIS 就完全没有这个问题。

    对于乐迷来说,使用 OGG 文件的显著好处是可以用更小的文件获得优越的声音质量。而且,由于 OGG 是完全 开放和免费的,制作 OGG 文件将不受任何专利限制,可望可以获得大量的编码器和播放器。这也是为何现在 MP3 编码器如此少而且大多是商业软件的原因,因为 Fraunhofer 要收取专利使用费。Vorbis 使用了与 MP3 相比完全不同 的数学原理,因此在压缩音乐时受到的挑战也不同。同样位速率编码的 Vorbis 和 MP3 文件具有同等的声音质量。

    Vorbis 具有一个设计良好、灵活的注释,避免了像 MP3 文件的 ID3 标记那样烦琐的操作;Vorbis 还具有位速率缩放: 可以不用重新编码便可调节文件的位速率。Vorbis 文件可以被分成小块并以样本粒度进行编辑;Vorbis 支持多通道; Vorbis 文件可以以逻辑方式相连接等。

    AMR
    AMR 全称 Adaptive Multi-Rate,自适应多速率编码,主要用于移动设备的音频,压缩比比较大,但相对其他的 压缩格式质量比较差,由于多用于人声,通话,效果还是很不错的。

    分类

    1. AMR: 又称为 AMR-NB,相对于下面的 WB 而言,语音带宽范围:300-3400Hz,8KHz 抽样
    2. AMR-WB:AMR WideBand, 语音带宽范围: 50-7000Hz 16KHz 抽样 “AMR-WB”全称为“Adaptive Multi-rate - Wideband”,即“自适应多速率宽带编码”,采样频率为 16kHz,是 一种同时被国际标准化组织 ITU-T 和 3GPP 采用的宽带语音编码标准,也称为 G722.2 标准。AMR-WB 提供语音带 宽范围达到 50~7000Hz,用户可主观感受到话音比以前更加自然、舒适和易于分辨。 与之作比较,现在 GSM 用的 EFR(Enhenced Full Rate,增强型全速率编码)采样频率为 8kHz,语音带宽为 200~ 3400Hz。 AMR-WB 应用于窄带 GSM(全速信道 16k,GMSK)的优势在于其可采用从 6.6kb/s, 8.85kb/s 和 12.65kb/s 三种编 码,当网络繁忙时 C/I 恶化,编码器可以自动调整编码模式,从而增强 QoS。在这种应用中,AMR-WB 抗扰度优于 AMR-NB。 AMR-WB 应用于 EDGE、3G 可充分体现其优势。足够的传输带宽保证 AMR-WB 可采用从 6.6kb/s 到 23.85kb/s 共九种编码,语音质量超越 PSTN 固定电话。

    声音数字化三要素

    采样频率 量化位数 声道数
    每秒钟抽取声波幅度样本的次数 每个采样点用多少二进制位表示数据范围 使用声音通道的个数
    采样频率越高 声音质量越好 数据量也越大 量化位数越多 音质越好 数据量也越大 立体声比单声道的表现力丰富,但数据量翻倍
    11.025kHz 22.05 kHz 44.1 kHz 8位=256 16位=65536 单声道 立体声

    声音数字化的数据量

    音频数据量=采样频率×量化位数×声道数/8(字节/秒)

    采样频率(kHz) 量化位数(bit) 单声道(KB/s) 立体声(KB/s)
    11.025 8 10.77 21.35
    11.025 16 21.53 43.07
    22.05 8 21.53 43.07
    22.05 16 43.07 86.13
    44.1 8 43.07 86.13
    44.1 16 86.13 172.27
  • 相关阅读:
    机械奥妙
    双向可控硅
    开关电源
    阻容降压电路
    手机充电电源的电路原理
    运算放大电路
    剃须刀电路
    d039: 点的位置
    d029: 求出2-100之间的所有质数(素数)
    d023: 各位数字之和
  • 原文地址:https://www.cnblogs.com/schips/p/12192594.html
Copyright © 2011-2022 走看看