zoukankan      html  css  js  c++  java
  • 深度学习语音降噪总结

      实时语音通信发展到今天,用户对通话语音质量提出了越来越高的要求。由于终端设备的多样性以及使用场景的差异,声音问题依然存在。传统的音频处理技术从声音信号本身出发,挖掘其时频特性,作出假设,建立物理模型,很多参数都需要人工进行精细化微调,比较费时费力。随着AI技术的发展,凭借着其强大的拟合能力,利用数据驱动,为改善音频体验提供了更多的可能性。

            关于理论部分,包括论文有很多,每种想法都存在一些问题,包括工程方面的,如需做落地,效果稳定良好,还需要做很多更多的工作,这里稍微做了下总结,深度学习降噪基本都在这份分享的PPT上面,降噪部分有些文章可能有些不太新了,但是还是有学习参考意义的。

       此处就分享几张DNN处理后的样本,增加一下新手的信心,处理非平稳噪声,效果还是非常明显的。

    white:

         

     destroyerengine:

        

    n32:

        

     n38

         

    n61:

        

    sil:

        

    coffee:

        

    PPT链接地址:

    百度云盘

    链接: https://pan.baidu.com/s/1vvUiiGtu-HUdZwclBSInZA 提取码: bsc5 

    实时语音通信的总结和深度学习降噪资料都可以直接在QQ群下载到

    QQ群:音频信号处理读书会 485186545

    如上群已满,请加新群: 音频处理与机器学习 238816966

     

  • 相关阅读:
    jquery toggle(listenerOdd, listenerEven)
    struts quick start
    hdu 1518 Square (dfs)
    hdu 2544 最短路 (最短路径)
    hdu 1754 I Hate It (线段树)
    hdu 1856 More is better (并查集)
    hdu 1358 Period (KMP)
    hdu 2616 Kill the monster (DFS)
    hdu 2579 Dating with girls(2) (bfs)
    zoj 2110 Tempter of the Bone (dfs)
  • 原文地址:https://www.cnblogs.com/welen/p/10529953.html
Copyright © 2011-2022 走看看