zoukankan      html  css  js  c++  java
  • 音频重采样

    对于采样率为Fs,长度为M个采样点的音频信号x[n],,通过采样因子P/Q进行重采样后,这个信号的样本数可以增大或者减小。该过程可以分为如下三个步骤[17]

    (1)上采样:在原信号相邻两点内插入P-1个零点,即创建一个有P (M-1)+1个采样点的信号xu[n],当n=1,2,…,M时,xu[P(n-1)+1] = x[n];否则,xu[n]=0。

    (2)插值:xu[n]和一个低通插值滤波器h[n]作卷积:xi[n]= xu[n]h[n]。

    (3)下采样:每隔Q-1个点抽取一个点,即创建有Q个点的信号xd[n],当n=1,2,…,+1时,xd[n]=xi[1+Q (n-1)],则重采样信号y[n]=xd[n]。(符号表示向下取整数)

    不同类型的重采样算法都可以分为上述三个过程,它们的唯一的区别就在于步骤2中所采用的插值滤波器的不同。其中,线性插值是最简单的插值算法,如式(4-1)。另外,常见的插值还包括样条插值、三次方插值等。

    注意事项:

    1.上采样时,会造成镜像信息,因此需要使用低通滤波器滤除(线性插值本身就是低通滤波器,因此不需要额外处理)。

    2.下采样时,可能会造成频谱混淆,因此在下采样之前用低通去混淆滤波器滤除。

    3.重采样算法非常消耗时间,使用多相滤波器与一些条件限制,可以大大提高运算速度。

    开源代码:

    1.http://code.google.com/p/falab/

          该段代码是针对单声道音频的重采样,不能直接分包(分段)处理。

    对于多声道音频的重采样,需要自己改写,可以支持多声道、分段重采样。

    2.ffmpeg内部集成了一套重采样代码。

         可以处理多声道音频的重采样,可以分段处理。但是存在一些bug。有些声道转起来会出问题、不支持,例如双声道转单声道。

    3.speex也集成了重采样接口

    下采样时,对离散信号再次进行P抽样(类似连续信号抽样);然后进行抽取。

    抽样,会引起频谱周期性偏移扩展, 2pi/P。

    抽取,相当于时域压缩,傅里叶变换对应于频域拉伸P倍。

    -pi~pi;   原始离散信号截止频率, -w0~w0,  扩展后  -w0*p~w0*p;   w0*p <=pi;

    滤波器截止频率:w0<= pi/P;  对原始信号进行提前滤波操作。

     抽取,相对于原始离散信号,频谱发生拉伸,容易造成混叠。

    同理,对于内插过程:

    内插的插零操作,相当于时域拉伸,对应于频谱压缩,造成镜像;

    第二步,通过低通滤除镜像。

    原始信号-pi~pi,重复出现。

    压缩N倍,则 原始信号  -pi*N~pi*N,  压缩到    -pi*pi; 

    有效带宽 -w~w;则压缩后变成了,  -w/N~-w/N,  -pi~pi压缩成 -pi/N~pi/N;其它镜像通过低通滤波器滤除掉。

    截止频率为  pi/N

    内插值的过程,相当于低通滤波。

  • 相关阅读:
    面试6 在c#中如何声明一个类不能被继承
    面试5 如何理解静态变量,局部变量,全局变量
    面试4 你在什么情况下会用到虚方法?它与接口有什么不同
    面试3 不用系统自带的方法将字符串类型123456转换为值类型
    面试2 递归的算法求1,1,2,3,5,8.......的第30位数是多少,然后求这些数的和.
    面试1 SQL SERVER 查询第20行到30之间的数据
    ubuntu安装nginx
    ubuntu上使用ufw配置管理防火墙
    ubuntu上安装docker
    ubuntu上使用vim编辑文本内容
  • 原文地址:https://www.cnblogs.com/welen/p/3284642.html
Copyright © 2011-2022 走看看