zoukankan      html  css  js  c++  java
  • 从朋友测试ISAC和SILK效果到二者理论比较

    之前写了关于ISAC的博客,但是SILK还没写

    最近盛大开发ET的朋友测试了一下ISAC和SILK的效果。这里已经征求朋友同意并大力支持。

    实验结果:SILK高码率更柔和,低码率(12kbps)会有背景噪声

                  ISAC高码率和低码率有些机械,磁化明显但有接近电话声音。

    (音质评估以人耳为主,可能存在主观倾向。但最终结果和编解码原理分析的结果一致。)

    理论分析:

    1. SILK虽然也分LTP分析和STP(LPC)分析,用来得到去除长时冗余和短时冗余。所谓长时冗余即是提取基音周期和增益。应该说借鉴了二元激励中的元音激励分析和短时谱冗余分析。但是没有开发辅音的类噪声分析。也没有使用白噪声计算噪声gain和残差矢量量化,而是使用噪声整形来处理。这里就使得量化噪声能均匀分布在多个频带。使得噪声不容易被感知。但这样的后果是在低码率下,噪声变得普遍很难被隐藏,所以这种做法会产生噪声,因为shaping已经不起作用。就像tone少噪声多,也就掩盖不住了。by the way,SILK使用了变长编码处理残差。

    2. ISAC使用了传统的CELP二元激励分析,在细节上做了创新,例如在压缩Pitch Lag和Pitch Gain上使用了KLT算法后才量化,和传统的直接标量量化和矢量量化不同。并且在残差谱编码上没有直接在时域用噪声谱逼近。而是使用了频域处理,用FFT转换后对实部和虚部进行噪声逼近编码。应该说是比较少见的。至于编码效率提高多少有待研究。并且使用了算数编码。我强烈怀疑专利问题。据我所知,大量算数编码的基础专利在IBM手上,这也是算数编码很多年应用不多的原因。如果ISAC没有专利问题,那可能的解释是,据我回忆,IBM的基础算数编码专利在2009~2011年左右到期,可能是ISAC使用的编码方式不侵犯IBM专利和后期非基础性算数编码专利。

    http://www.cnblogs.com/gaozehua/archive/2012/02/14/2350522.html

    http://www.cnblogs.com/gaozehua/archive/2012/02/14/2350480.html

    http://www.cnblogs.com/gaozehua/archive/2012/02/14/2350504.html

    总结:ISAC在低码率(12K左右会好于SILK),高码率SILK会更显柔和。

  • 相关阅读:
    Fiddler 教程
    Mongodb for C# 分组查询
    C# CryptoStream
    ECharts 纯Javascript图表库
    Mongodb For C# "Query" 对象常用的方法
    WPF 获取指定文件的Icon
    SymbolSource
    ubuntu下安装Docker
    老李推荐:第1章2节《MonkeyRunner源码剖析》概述:边界
    老李推荐: 第1章1节《MonkeyRunner源码剖析》概述:前言
  • 原文地址:https://www.cnblogs.com/gaozehua/p/2423674.html
Copyright © 2011-2022 走看看