1 数字音频基础知识
1.1 声音的基本概念
语音+音乐+自然声
声音的基本概念
周期 振幅 频率
可听声波
20Hz ~ 20kHZ
小于20Hz的是次声波
大于20kHz的是超声波
人声音在 300Hz ~ 3kHz 之间
声音的听觉特征
声音的元素
1.2 声音的数字化
数字音频质量三要素
声音数字化的数据量
1.3 音频的文件格式
WAV
MS和IBM共同开发的PC波形文件, 不压缩, 文件数据量很大
MP3
MPEG Audio layer 3
是一种按照MPEG标准的音频压缩技术
WMA
Windows Media格式的一个子集
压缩到mp3的一半 音质不变
MIDI
乐器数字接口, 是一组声音或者乐器符号的集合
数据量小但是缺乏重现自然音
1.4 声音的采集和处理
采集
直接录取
录音棚
唱片
数字音频库
处理
删除无用部分
降噪
调节均衡, 高中低频段
添加混响, 延迟和变速
音频文件格式的转换
2 数字音频压缩标准
2.1 概述
编解码过程
压缩编码技术
基本依据
声音信号存在大量冗余
强音能够抑制弱音
压缩编码的分类
2.2 音频压缩技术标准
音频压缩技术标准
2.3 音频压缩工具软件
主要有 Audio Converter; MP3 Resizer
3 声卡与电声设备
声卡: 声音的基本的硬件设备
性能指标
采样和量化能力
采集分为11.025(语音) 22.05(音乐) 44.1(高保真)
量化 8(语音) 16(高保真)
芯片类型
CODEC占用CPU资源
DSP 不需要CPU资源可以独立运行
总线类型
ISA; PCI; USB
输出声道数
2; 2.1; 4.1; 5.1声道
外部接口
线性输入; 线性输出; 扬声器输出; MIDI接口
传声器
话筒, 麦克风
原理
电磁换换能原理
性能指标
灵敏度; 频率响应; 指向性; 输出阻抗
扬声器
喇叭, 电信号转化为声音
音响
扬声器系统
声道数
2.0表示双声道
2.1是双声道+超重低音声道 也就是说0.1就是指低音炮
4.1/5.1/7.1 主流首选5.1
性能指标
输出功率: 一般显示的是最大功率
频率范围
信噪比: 70~80db普通
80~90db 高档
>95db 专业音响
4 电子音乐与MIDI
发展
留声机, 电吉他, 电贝司等
电子合成器
MIDI音乐技术
MIDI乐器数字接口
MIDI的合成方法
调频合成法FM
波形合成法WT
计算机音乐系统
MIDI键盘
音序器: 能够将音乐的各种要素以数字的语汇进行有序的排序
音序软件
音乐软件的分类
5 音频编辑软件
5.1 Audition概述
录制声音的软件有: 录音机; 录音大师; Wave Studio; Audition
Audition的前身是Cool Edit Pro
Cool Edit Pro 2000是其中的主流产品
基本功能
是集声音录制, 音频混合和编辑与一身的音频编辑软件
窗口组成
标题栏; 菜单栏; 工具栏; 编辑器; 功能面板; 状态栏
5.2 音频文件的管理
Audition支持的格式
音频格式: MP3; WAV; WMA
动画格式: SWF
视屏格式: FLV
(1) 打开音频文件
文件-->打开
(2) 追加打开
文件-->追加打开
可以选择打开到新文件或者到之前的文件之后
(3) 导入文件
文件-->导入
导入文件与打开文件的区别就是是在源文件上的处理还是导入之后在内存上处理
(4) 创建音频文件
文件-->新建-->音频文件
在上面可是填入需要的内容(文件名等)
(5) 创建多轨合成项目
文件-->新建-->多轨合成项目
在要插入的音轨上右键-->插入-->文件
(6) 从CD中提取音频
文件-->从CD中提取
(7) 保存音频文件
文件-->下面有五种保存方式, 可以根据需要点击保存
5.3 控制声音播放
可以通过走带面板控制
5.4 波形的缩放和滚动
在走带面板右侧的 可以点击
含义分别是:振幅放大, 缩小, 周期放大, 缩小, 全面缩小, 放大入点, 缩小入点, 缩至放选区
5.5 录音技术
在波形下录制
在波形面板里 右键新建一个音频文件
通过点击走带面板的 录制 按钮, 就可以录制声音
注意录制的时候的电平的变化, 如果出现红色就有可能爆音
但是音量也不能太小, 要保证在右侧的一个区域是最好的
在多轨界面下录制
新建多轨项目, 单机音轨的R按钮,进入准备录音状态
在走带面板中点击录制按钮
5.6 音频的剪辑
选取波形
ctrl+A或者双击 选取全部
多轨中可以通过上下键 选择其中一个音轨
可以选取多个音轨, 也可以只处理一个音轨
复制波形
ctrl+C
ctrl+shift+C 复制成一个新的文件
剪切
ctrl+X
粘贴
ctrl+V
还有一个混合粘贴
删除
delete
裁剪
选取的波形保留
ctrl+T
5.7 改变振幅
用于调节声音大小
效果-->振幅与压限-->振幅
通过向左移动来减小
5.8 淡入淡出
效果-->振幅与压限-->淡化包络
选择预设的处理模式来设置淡入或者淡出
5.9 降低噪音
在语音停顿处有一种振幅变化不大的声音就是噪音
处理的方法
选择噪音样本, 最好大于1秒
效果-->降噪/修复-->降噪
点击选择完整文件, 进行匹配噪音并将整个文件匹配的声音去除
5.10 延迟和回声效果
延迟是原始信号的复制, 以毫秒间隔再现
回声与原始音频间隔时间长, 可分辨出原始信号与回声信号
分类:
模拟延迟
延迟
回声
模拟延迟
模拟延迟效果可模拟老式的硬件延迟效果器的声音, 使用特性失真和调整立体声
要创建离散回声, 延迟要35ms或者更多
创建方法:
效果-->延迟与回声-->模拟延迟
延迟效果
用于创建简单的回声和一些其他效果
1-14ms 在空间定位一个单声道声音
15-34ms 创建简单的合唱或者镶边效果
35ms以上 创建离散的回声
操作方法
效果-->延迟与回声-->延迟
回声效果
添加一系列重复衰减
操作
效果-->延迟与回声-->回声
5.11 声音没学
提高声音的质量
润色声音
加工声音
相关因素:
清晰度; 噪音; 音色; 旋律
6 语音识别技术
主要应用
将语音转化为文字
辨别说话人的身份
基本原理
本质上是模式识别的过程