zoukankan      html  css  js  c++  java
  • SILK 预测模块分析

    SILK是一种新结构的基于噪声整形量化算法的编解码框架。不同于类CELP的AMR,EVRC,G729,Speex等标准。

    类CELP的结构都是以码本激励为量化框架的编码器。但是这里并不讨论NSQ结构和CE(VQ)结构的区别。

    这里想描述一下SILK的预测模型。

    通常语音编码器都是基于LP模型。

    但是SILK里面的LP和CELP的LP不同的是

    在CELP里面,LPC分析的输入是原始的PCM加窗,做自相关计算求LPC系数。(包括AMR,G729,EVRC,Speex)

    在SILK里面,LPC分析是对经过Pitch tracking之后去掉了Pitch的残差,再对voice信号做LTP分析的后去掉LTP的残差进行分析。就是说,进入到LPC分析的输入可能是经过了2级长时滤波的残差(通常pitch提取也是一种LTP分析)。再对这个残差做LPC分析。

    这样做的原因是什么呢?好处是什么呢?(待信号图测试验证,仅仅是经验原理推测)

    LPC系数在频谱上是逼近输入信号的功率谱(PSD)的,那么功率谱是体现信号的基频和谐波特性的。

    对基音分析和LTP分析实际上是从帧间分析信号的基频和谐波的特性的。而分析后的残差的PSD也是去掉了基频和谐波的,会显得更为平滑。

    再对他做LPC分析,会更少帧间干扰,更容易逼近,发挥LPC的低通信号逼近的特性。

  • 相关阅读:
    Ruby
    WebGL的第二个小程序
    wegGL的第一个小程序
    Node.js介绍
    接口隔离原则(Interface Sepreation Principle)
    参数
    字段/属性
    接口和抽象类
    javascript中的事件
    线性回归算法-4.多元线性回归算法
  • 原文地址:https://www.cnblogs.com/gaozehua/p/3240258.html
Copyright © 2011-2022 走看看