分离webrtc的降噪(Noise Suppression)部分
webrtc是Google开源的优秀音视频处理及传输代码库,其中包含了audio processing、video processing算法。语音降噪模块就包含在audio processing中。本文的降噪算法引用自https://github.com/cpuimage/WebRTC_NS,用c语言编写,需要编译成exe可执行程序供c#程序调用。
使用cmake生成vs2017工程
cmake是一款生成c/c++项目的工具,下载地址:https://cmake.org/download/。
https://github.com/cpuimage/WebRTC_NS源码中包含了cmake所需的CMakeLists.txt.使用cmake工具生成vs工程的时候有两个坑需要注意:
- CMakeLists.txt的最后一句“target_link_libraries(ns m)”需要注释掉,否则会报link-error.
- cmake生成的工程main.c编码为uft.因为源文件里边有汉字,需改变编码为GBK。改变编码的方法为在vs2017打开的工程中,点击“文件”下面的“高级保存选项”。如果没有“高级保存选项”的请百度如何调出。
编译c源程序
在vs2017中按f5编译源程序。生成完之后会在debug文件下出现:
使用方法:拖一个.wav文件到ns.exe上面,出现命令行窗口。命令行执行完毕后会在.wav文件旁边生成一个降噪后的.wav文件。
本人之前的项目HtwMedia(https://blog.csdn.net/u014220286/article/details/88895867)中就用到了ns.exe程序,对语音识别性能提高还是比较明显的。
C#中调用ns.exe
string wav = "wav文件绝对路径";
using (Process proc = new Process())
{
proc.StartInfo.FileName = "ns.exe";
proc.StartInfo.Arguments = string.Format(@" ""{0}""", wav);
proc.Start();
proc.WaitForExit();
}
上述ns.exe要是绝对路径。可以设置环境变量只写ns.exe.c#中设置环境变量的方法:
Environment.SetEnvironmentVariable("Path", Environment.GetEnvironmentVariable("Path") + ";exe路径");
上述语句要写两遍才执行,具体原因未可知。