SILK 预测模块分析 - 走看看

zoukankan html css js c++ java

SILK 预测模块分析

SILK是一种新结构的基于噪声整形量化算法的编解码框架。不同于类CELP的AMR，EVRC,G729，Speex等标准。

类CELP的结构都是以码本激励为量化框架的编码器。但是这里并不讨论NSQ结构和CE（VQ）结构的区别。

这里想描述一下SILK的预测模型。

通常语音编码器都是基于LP模型。

但是SILK里面的LP和CELP的LP不同的是

在CELP里面，LPC分析的输入是原始的PCM加窗，做自相关计算求LPC系数。（包括AMR，G729，EVRC,Speex）

在SILK里面，LPC分析是对经过Pitch tracking之后去掉了Pitch的残差，再对voice信号做LTP分析的后去掉LTP的残差进行分析。就是说，进入到LPC分析的输入可能是经过了2级长时滤波的残差（通常pitch提取也是一种LTP分析）。再对这个残差做LPC分析。

这样做的原因是什么呢？好处是什么呢？（待信号图测试验证，仅仅是经验原理推测）

LPC系数在频谱上是逼近输入信号的功率谱（PSD）的，那么功率谱是体现信号的基频和谐波特性的。

对基音分析和LTP分析实际上是从帧间分析信号的基频和谐波的特性的。而分析后的残差的PSD也是去掉了基频和谐波的，会显得更为平滑。

再对他做LPC分析，会更少帧间干扰，更容易逼近，发挥LPC的低通信号逼近的特性。

查看全文

相关阅读:
C#解析数组形式的json数据
 js中的Array数组清空
 H5在js中向指定的元素添加样式
 C#的扩展方法
 C#常用设计模式
 Peasy.NET学习之并发问题处理
 dev中，usercontrol打印界面内容，打印预览和打印
 PL SQL 存储过程 SQL SERVER创建存储过程及调用，Oracle创建存储过程及调用
 C# 事务的创建，提交和回滚
 dev 中字符串转中文拼音缩写，对grid列表进行模糊匹配，grid获取焦点行，gridlookupedit控件用拼音模糊匹配下拉选项

原文地址：https://www.cnblogs.com/gaozehua/p/3240258.html

Copyright © 2011-2022 走看看