zoukankan      html  css  js  c++  java
  • 语音交互技术——语音信号特征提取

    1.短时能量分析(音强),决定短时能量特性有两个条件:不同的窗口的形状和长度。窗长越长,频率分辨率越高,而时间分辨率越低(N为帧长,M为步长)。

    image

    *典型窗函数:矩形窗谱平滑性能好,但损失高频成分,波形细节丢失,海明窗与之相反。一帧内含1~7个基音周期,10kHz下采100~200点。

    imageimage

    2.短时平均振幅分析:计算方法简单,但清浊音的区分不如能量明显。

    image

    3.短时过零分析:可以区分清音与浊音,浊音时具有较低的平均过零数,而清音时具有较高的平均过零数;可以从背景噪声中找出语音信号,可用于判断寂静无语音和有语音的起点和终点位置。

    image

    4.短时相关分析:自相关用于研究信号本身,如信号波形的同步性、周期性等。用来区分清音和浊音,因为浊音信号是准周期性的,对浊音语音可以用自相关函数求出语音波形序列的基音周期;另外在进行语音信号的线性预测分析时,也要用到短时自相关函数。

    image

    image

    image

    4.短时平均幅度差:短时平均幅度差计算加、减法和和取绝对值的运算,与自相关函数的相加与相乘的运算相比,其运算量大大减小,尤其在硬件实现语音信号分析时有很大好处。为此,AMDF已被用在许多实时语音处理系统中。

    image

    image

    5.短时傅里叶变换:

    image

    image

    6.语音信号的倒谱分析:求语音倒谱特征参数,通过同态处理(将非线性问题转化为线性问题)来实现。同态处理(同态滤波):解卷,将卷积关系变为求和处理。 将语音信号的声门激励和声道响应分离开。

    image

    image

    image

    7.基音周期的提取:

    a)自相关法:峰—峰值之间对应的就是基音周期。为去除声道影响,一般进行中心削波的非线性变换(削除低幅部分)。

    image

    b)倒谱法:图a为ln|X(ejw)|的示意图,包括频谱包络的慢变分量,基音谐波峰值的快变分量。再取一次傅里叶反变换,即可将快慢分量分离开。

    image

    基音周期后处理:中值平滑、线性平滑、组合平滑。

  • 相关阅读:
    了解及使用IPV6
    天气预报API(六):中国气象频道、腾讯天气--“新编码”接口的测试
    天气预报API(五):城市代码--“新编码”和“旧编码” 对比
    天气预报API(三):免费接口测试(“旧编码”)
    nginx 配置反向代理和静态资源
    centos 7 安装mysql5.7
    java 重新学习 (四)
    java 重新学习 (三)
    java 重新学习 (二)
    h5唤醒手机拨打电话
  • 原文地址:https://www.cnblogs.com/jizhiyuan/p/3739765.html
Copyright © 2011-2022 走看看