zoukankan      html  css  js  c++  java
  • MFCC可视化

          大多数文章和博客介绍都是MFCC的算法流程,物理意义,这里仅仅从数据分布可视化的角度,清晰

    观察MFCC特征在空间中的分布情况,加深理解。

          MFCC处理流程:

          MFCC参数的提取包括以下几个步骤: 
    1.预滤波:CODEC前端带宽为300-3400Hz的抗混叠滤波器。 
    2.A/D变换:8kHz的采样频率,12bit的线性量化精度。 
    3.预加重:通过一个一阶有限激励响应高通滤波器,使信号的频谱变得平坦,不易受到有限字长效应的影响。 
    4.分帧:根据语音的短时平稳特性,语音可以以帧为单位进行处理,实验中选取的语音帧长为32ms,帧叠为16ms。
    5.加窗:采用哈明窗对一帧语音加窗,以减小吉布斯效应的影响。 
    6.快速傅立叶变换(Fast Fourier Transformation, FFT):将时域信号变换成为信号的功率谱。 
    7.三角窗滤波:用一组Mel频标上线性分布的三角窗滤波器(共24个三角窗滤波器),对信号的功率谱滤波,每一个三角窗滤波器覆盖的范围都近似于人耳的一个临界带宽,以此来模拟人耳的掩蔽效应。 
    8.求对数:三角窗滤波器组的输出求取对数,可以得到近似于同态变换的结果。 
    9.离散余弦变换(Discrete Cosine Transformation, DCT):去除各维信号之间的相关性,将信号映射到低维空间。 
    10.谱加权:由于倒谱的低阶参数易受说话人特性、信道特性等的影响,而高阶参数的分辨能力比较低,所以需要进行谱加权,抑制其低阶和高阶参数。 
    11. 倒谱均值减(Cepstrum Mean Subtraction, CMS):CMS可以有效地减小语音输入信道对特征参数的影响。 
    12.差分参数:大量实验表明,在语音特征中加入表征语音动态特性的差分参数,能够提高系统的识别性能。在本系统中,我们也用到了MFCC参数的一阶差分参数和二阶差分参数。 
    13.短时能量:语音的短时能量也是重要的特征参数,本系统中我们采用了语音的短时归一化对数能量及其一阶差分、二阶差分参数。 

         图形可视化:

  • 相关阅读:
    第五篇:在SOUI中使用XML布局属性指引(pos, offset, pos2type)
    第四篇:SOUI资源文件组织
    第三篇:用SOUI能做什么?
    第二篇:SOUI源码的获取及编译
    第一篇:SOUI是什么?
    BuildFilePath 及打开文件对话框
    Java的synchronized关键字:同步机制总结
    Synchronized Methods
    java synchronized详解
    深拷贝与浅拷贝探析
  • 原文地址:https://www.cnblogs.com/welen/p/4096708.html
Copyright © 2011-2022 走看看