重采样常用于音频处理。在用麦克风对音频进行采集的时候,常见的采样率有8k(电话)、44.1k(CD)、48k(视频音轨)、96k/192k(Hi-Res),而某些系统会有默认固定的输出采样率(如Android的默认输出采样率为44.1k),此时就需要对输入音频数据进行重采样。
重采样的源样本序列为$x[n]$
$x[n] = x_c(nT)$
重采样的目标序列为$x'[n]$
$x'[n] = x_c(nT')$
如何通过$x[n]$得到$x'[n]$就是本文的讨论内容。
本文假设以采样周期为$T$对$x_c(t)$进行采样满足奈奎斯特采样定律。
减采样(downsampling)
减小采样率的过程被称为减采样,这一小节讨论的是按整数倍减小采样率。
按照我们一般的思维来说,按整数倍(倍数为$M$)减少采样率应该是直接对源样本序列每隔$M$个样本提取一个值
$x_d[n] = x[nM] = x_c(nMT)$
这种提取方法被称为采样率压缩器,简称压缩器(compressor)。可以看到所得的新序列是原始连续信号的一部分,并且新序列的采样周期为$T_d = MT$。对于该新序列,我们可以分为两种情况进行讨论:
- $T_d$符合奈奎斯特采样定理,即新序列能通过一个低通滤波器还原为原始的连续信号
- $T_d$不符合奈奎斯特采样定理,即新序列发生混叠,无法还原为原始的连续信号
如下图假设信号在$M=2$时恰好满足奈奎斯特采样定理,那么在$M=3$时则会发生混叠
如果在采用了压缩率为$M$的压缩器后,序列仍然符合奈奎斯特采样定理,我们可以直接进行使用$x_d[n] = x[Mn]$来得到减采样序列。而发生混叠的情况则稍微复杂一点。观察混叠的频谱,可以发现只有低频部分保持了与原始信号频谱的一致性,而相当多的高频由于混叠而失去了原始频谱。
频谱丢失得越多说明信号的失真越大,因此为了减少失真,需要尽可能保留更多的原始信号频谱。我们可以先对元素信号进行低通滤波,然后再对滤波后的信号进行周期为$MT$的采样即可得到失真更少的序列。按照这种思想,采样周期固定为$MT$,如果一个被采样信号的采样周期为$MT$,那么采样后不会混叠的条件就是该信号的截至频率为$frac{pi}{MT}$,因此低通滤波的截至频率为$frac{pi}{MT}$。
很明显,先低通滤波后采样的这种方法能最大限度地减低频谱的丢失,从而降低信号失真。
$ ilde{X}_d(jOmega) = X_c(jOmega)H_{M}(jOmega)$
其中$ ilde{X}_d(jOmega)$就是对原始信号进行低通滤波后的信号$ ilde{x}_d(t)$的傅里叶变换,低通滤波器的傅里叶变换为$H_{M}(jOmega)$。不过我们手中的并不是原始信号$x_c(t)$,而是序列$x[n]$,为了进入上述流程,我们需要先用$x[n]$重构出$x_c(t)$,才能进行低通滤波以及后续采集
$egin{align*}
ilde{x}_d(t)
&= mathcal{F}^{-1} ilde{X}_d(jOmega)\
&= mathcal{F}^{-1}{X_c(jOmega)H_{M}(jOmega)}\
&= mathcal{F}^{-1}{X(e^{jOmega T})H_r(jOmega)H_{M}(jOmega)}\
&= mathcal{F}^{-1}{X(e^{jOmega T})TH_{M}(jOmega)}
qquad
left{egin{matrix}
H_r(jOmega)&=left{egin{matrix}T, & |Omega|<pi/T\ 0, & elseend{matrix}
ight.quad\
H_M(jOmega)&=left{egin{matrix}1, &|Omega|<pi/MT \ 0, & elseend{matrix}
ight.\
end{matrix}
ight .\
&= mathcal{F}^{-1}{X_s(jOmega)TH_M(jOmega)}\
&= x_s(t)*[MTcdot h_m(t)]/Mqquad fourier convolution theorem\
&= left{sum_{n=-infty}^{infty}x[n]delta(t-nT)
ight}*left{frac{sin(pi t/MT)}{pi t/MT}
ight}/M\
&= sum_{n=-infty}^{infty}x[n]frac{sin[pi(t-nT)/MT]}{pi(t-nT)/MT}/M
end{align*}$
然后从$ ilde{x}_d(t)$中以$MT$为周期采集得到$ ilde{x}_d[n]$
$color{red}{egin{align*}
ilde{x}_d[n] &= ilde{x}_d(nMT)\
&= left .sum_{k=-infty}^{infty}x[k]frac{sin[pi(t-kT)/MT]}{pi(t-kT)/MT}/M
ight|_{t=nMT}\
&= sum_{k=-infty}^{infty}x[k]frac{sin[pi(nMT-kT)/MT]}{pi(nMT-kT)/MT}/M\
&= sum_{k=-infty}^{infty}x[k]frac{sin[pi(nM-k)/M]}{pi(nM-k)/M}/M
end{align*}}$
如果要从连续时间系统来理解的话,我们可以发现重建的连续信号$ ilde{x}_d(t)$是由无数个$x[k]$分别对相应位置的截至频率为$pi/MT$的sinc函数进行加权后叠加,然后对叠加得到的信号的幅度除以$M$得到的。
如果要从离散时间系统来理解$ ilde{x}_d[n]$的构造公式的话,可以发现上面公式中的sinc函数有如下规律(下二)
$egin{matrix}
H(e^{jomega}) =left{egin{matrix}M, &|omega|<pi/M \0, &else end{matrix}
ight .& Leftrightarrow &
h[n] = displaystyle{frac{sin[pi n/M]}{pi n/M}}\
H(e^{jomega}) =left{egin{matrix}1, &|omega|<pi/M \0, &else end{matrix}
ight .& Leftrightarrow &
h[n]=displaystyle{frac{sin[pi n/M]}{pi n/M}/M}
end{matrix}$
可以发现该sinc函数是一个增益为1、截至频率为$pi/M$的低通滤波器,该滤波器后接因子为M的压缩器。那么,前面的公式可以理解为:用该滤波器对$x[k]$进行滤波后再用因子为M的压缩器即可得到$ ilde{x}_d[n]$。这一过程又被称为抽取(decimation)。
增采样(upsampling)
增加采样率的过程被称为增采样,这一小节讨论的是按整数倍增加采样率。
假设增加采样率的倍数为$L$,那么增加采样率后的采样周期为$T_i = LT$,有
$x_i[n] = x_c(nT_i) = x_c(nLT)$
不过实际上我们只有采样周期为$T$的序列$x[n]$,因此需要先进行$x_c(t)$的重建,然后对$x_c(t)$进行周期为$T_i$的采样
$color{red}{egin{align*}
x_i[n] &= x_c(nT/L)\
&= left .sum_{k=-infty}^{infty}x[k]frac{sin[pi(t-kT)/T]}{pi(t-kT)/T}
ight|_{t=nT/L}\
&= sum_{k=-infty}^{infty}x[k]frac{sin[pi(nT/L-kT)/T]}{pi(nT/L-kT)/T}\
&= sum_{k=-infty}^{infty}x[k]frac{sin[pi(n-kL)/L]}{pi(n-kL)/L}
end{align*}}$
下面我们从频域来展开讨论
增采样即采样频率提高了,因此不会出现混叠的情况,即不会改变原始的连续时间信号。现假设用采样周期$T$对$x_c(t)$进行采样恰好满足奈奎斯特采样定理,即有
增采样后采样周期为$T_i = T/L$,那么频谱将有如下变化
观察两张图右下角的$X(e^{jomega})$以及$X_i(e^{jomega})$,它们的时域表示分别就是我们的源序列$x[n]$与目标序列$x_i[n]$。从$X(e^{jomega})$变为$X_i(e^{jomega})$只需进行执行两个步骤:
- 对$X(e^{jomega})$的变量$omega$进行倍数为$L$的扩展,得到$X_e(e^{jomega}) = X(e^{jomega L})$
- 对所得的新频谱进行低通滤波,滤波器的增益为$L$,截至频率为$frac{pi}{L}$
对第一步有如下分析:
$egin{align*}
X(e^{jomega}) &= sum_{n=-infty}^{infty}x[n]e^{-jomega n}\
Rightarrow X(e^{jomega L}) &= sum_{k=-infty}^{infty}x[k]e^{-jomega Lk}\
&= sum_{n/L=-infty}^{infty}x[n/L]e^{-jomega n} qquad n=Lk\
Rightarrow x_e[n] &= left{egin{matrix} x[n/L], &n = 0,pm L, pm 2Lcdotcdotcdot\0, &elseend{matrix}
ight.
end{align*}$
如下图所示,对序列$x[n]$进行步长为$L$的扩展,即可得到$x_e[n]$,这种转换称为扩展器(expander)
第二步的低通滤波器的增益为$L$、截至频率为$pi/L$,即其脉冲响应为(从前面的增采样公式同样也能得出该结论)
$h_i[n] = frac{sin(pi n/L)}{pi n/L}$
因此增采样系统分解如下图,这一过程又被称为内插(interpolation)。
简单的内插滤波采样
在对序列进行内插时,某些情况下,我们并不用追求很准确的信号还原,此时用一些简单的滤波器即可达到不错的效果,如常见的线性内插、三次样条内插等。
$h_{lin}[n] =left{ egin{matrix} 1-|n|/L , & |n|leqslant L\ 0, &elseend{matrix}
ight.
qquadqquad h_{cu}[n] = left{ egin{matrix}
(a+2)|n/L|^3 -(a+3)|n/L|^2+1, &0leqslant |n|leqslant L\
a|n/L|^3-5a|n/L|^2+8a|n/L|-4a, &Lleqslant |n|leqslant 2L\
0, &else
end{matrix}
ight.$
- 线性内插只用到内插的位置两旁的两个样本,在图上表示的话,就是把两个样本用直线连接后,该直线在对应内插位置上的的值就是所求的内插值。
- 三次样条内插会用到内插位置两旁的四个样本,即左右各两个,曲线类似于对低通滤波器进行截取后的曲线(下面取$L=5, a=-0.5$)。
观察上面两个脉冲响应,我们能发现这些简单内插器脉冲响应的一些规律:
- 零点的左右两边对称,$ ilde{h}[n] = ilde{h}[-n]$
- 长度为$2KL-1,K=1,2,cdotcdotcdot$,也就是说左右两边距离零点超过KL时的值为0,即$ ilde{h}[n] = 0,|n|geqslant KL$·
- 零点处的值为1,$h[0] = 1$
- KL处的值为0,$h[KL] = 0$
既然有这些简单但不够准确的内插器,那么就应该有相应的方法来判断这些内插器的内插效果。内插效果可以通过观察这些内插器的频谱来进行分析。
对比增采样所需要的低通滤波器跟简单的线性内插器频谱,可以发现在频谱的$omega<frac{pi}{L}$处本应做大小固定为$L$的增益,但是线性内插在这部分有衰减,另外在$omega>frac{pi}{L}$处本应该是对原始序列频谱进行截断,但是由于线性内插器的频谱在$omega>frac{pi}{L}$仍然有较大的能量(幅度较高),因此可见线性内插可能不会获得很令人满意的内插效果。不过如果原本的采样频率就远大于原始信号的截至频率,则表明采样所得的序列的频谱较为集中,此时采用线性内插则会得到较好的效果。
对比线性内插以及三次样条内插,可以发现在$omega<frac{pi}{L}$处,三次样条的旁瓣较宽,而在$omega>frac{pi}{L}$处,三次样条的能量更小(幅度更低),即三次样条更接近于低通滤波器,因此三次样条内插会比线性内插的效果更好。
图中蓝色实线为线性内插频谱,红色虚线为三次样条内插频谱。为了更突出两者的频谱差异,右图对频谱的幅度进行了对数运算。
非整数因子重采样
我们前面讨论了减采样以及增采样,它们的系统分别被称为抽取器与内插器。对于非整数因子,我们可以通过先接一个内插器,后接一个抽取器这种级联的方式来得到该重采样系统。例如,若$L=100,M=101$,则重采样的周期为$1.01T$
由于中间两个都是低通滤波器,因此可以合并成一个低通滤波器,取其中的最小值$min(pi/L, pi/M)$作为截至频率,增益为L。