Windows下音视频对讲演示程序（声学回音消除、噪音抑制、语音活动检测、自动增益控制、自适应抖动缓冲）（2021年11月10日更新）

zoukankan html css js c++ java

Windows下音视频对讲演示程序（声学回音消除、噪音抑制、语音活动检测、自动增益控制、自适应抖动缓冲）（2021年11月10日更新）

Windows下音视频对讲演示程序

必读说明

简介

本软件根据《道德经》为核心思想而设计，实现了两个设备之间通过TCP或UDP协议进行全双工实时音视频对讲，并做了以下增强处理：

支持8000Hz、16000Hz、32000Hz、48000Hz的音频。

支持声学回音消除，通过本人自己设计的音频输入输出帧同步方法、自适应设置回音延迟方法、三重声学回音消除器，声学回音可以消除到99%以上，还可以消除同一房间回音，且收敛时间很短，无论网络如何抖动都可以消除。

支持噪音抑制，对常见的底噪音、嘈杂的街道音、风吹音、等都有抑制效果。

支持语音活动检测，只有在人说话时才发送网络数据，无人说话时不产生网络数据，从而降低噪音、降低网络流量。

支持自动增益控制，当人说话声音较小时会自动增大音量，当人说话声音较大时会自动减小音量。

支持音频编解码，对音频数据的压缩率在1~20%之间，且支持动态比特率，从而大幅度降低网络流量，还支持数据包丢失隐藏，当网络丢包率高达30%时，仍然可以进行对讲。

支持视频编解码，支持指定比特率，最低到10KB/s仍然可以进行视频对讲。

支持音视频自适应抖动缓冲，当网络存在丢包、乱序、延时等抖动情况时，通过自适应调节缓冲深度来应对这些抖动。

支持与Android下音视频对讲演示程序进行全双工实时音视频对讲。

声学回音消除器效果对比：

准备

准备两台安装了Windows XP及以上系统的设备（已适配到Windows 10），其中一台设备作为客户端可以连接到另一台作为服务端的设备（可以用Ping工具测试，建议两台设备在同一局域网内），且两台设备都安装相同版本的本软件。

开始

在一台设备上直接点击创建服务端，再在另一台设备上将IP地址改为服务端设备的IP地址，并点击连接服务端，即可开始对讲，在任意一端点击中断，即可中断对讲。

设置按钮提供了各项功能的参数设置，绝大部分情况下都不需要修改，当然你也可以根据需要自行修改。

特别注意：如果把两台设备放在同一房间里测试，有可能会出现啸叫、声音不完整、等问题，这是因为现在的麦克风都很灵敏了，一点小小的声音都会被录进去，两台设备会相互录音，导致软件无法正确识别回音，所以建议放在不同的房间里测试。如果实在要测试这种情况，就在设置里，Speex预处理器的其他功能设置里，关闭“使用自动增益控制”后再测试。

移植

如果需要在自己的软件中使用本软件的音频功能，只需要将MediaProcThread.h、MediaProcThread.cpp和各个库文件夹复制到自己的软件中，然后实现实现UserInit、UserProcess、UserDestroy、UserReadAudioVideoInputFrame、UserWriteAudioOutputFrame、UserGetPcmAudioOutputFrame、UserWriteVideoOutputFrame、UserGetYU12VideoOutputFrame这八个函数即可。

如果有不需要的部分功能，则只需要删除该功能对应头文件和库文件，然后修改MediaProcThread.h、MediaProcThread.cpp文件即可。

普通免费功能包括：WebRtc定点版声学回音消除器、Speex预处理器的噪音抑制、WebRtc定点版噪音抑制器、WebRtc浮点版噪音抑制器、Speex预处理器的其他功能、Speex编解码器、Wave文件读取器、Wave文件写入器、本端TCP协议服务端套接字、本端TCP协议客户端套接字、本端UDP协议套接字。

高级收费功能包括：Speex声学回音消除器、WebRtc浮点版声学回音消除器、SpeexWebRtc三重声学回音消除器、RNNoise噪音抑制器、OpenH264编解码器、自己设计的自适应抖动缓冲器。

注意

从老版本更新到新版本时，类文件和库文件全部都要更新，不能只更新类文件或库文件，否则会导致意想不到的问题。

如果要使用8000Hz采样频率时，最好不要使用RNNoise噪音抑制，因为它对8000Hz的声音抑制非常强烈。

本软件不支持音乐，尤其是RNNoise噪音抑制器可能对音乐的抑制非常强烈。

某些Windows设备的软硬件环境可能存在问题，从而可能会导致声学回音消除失败，这种情况必须要先解决这些问题。

其他

本软件采用了Speex的1.2.0版本、SpeexDsp的1.2.0版本、WebRtc的2019年7月份版本、OpenH264的2021年3月份版本为基础，并进行了大量优化。

讨论QQ群：511046632 欢迎大家参与测试和讨论！

本人QQ号：280604597 赤勇玄心行天道

本人博客：http://www.cnblogs.com/gaoyaguo

Windows版源代码：https://github.com/cyz7758520/Windows_audio_talkback_demo_program

https://gitee.com/chen_yi_ze/Windows_audio_talkback_demo_program

Android版源代码：https://github.com/cyz7758520/Android_audio_talkback_demo_program

https://gitee.com/chen_yi_ze/Android_audio_talkback_demo_program

版权

Speex：https://gitlab.xiph.org/xiph/speex/-/blob/master/COPYING

WebRtc：https://gitlab.com/webrtc-mirror/webrtc/-/blob/master/LICENSE

RNNoise：https://gitlab.xiph.org/xiph/rnnoise/-/blob/master/COPYING

OpenH264：https://github.com/cisco/openh264/blob/master/LICENSE

LibYUV：https://github.com/lemenkov/libyuv/blob/master/LICENSE

感谢

感谢 WELEN、善书、陈国福对 Speex、WebRTC 的指点！

查看全文

相关阅读:
数据类型说明
 python基础之编码的定义和种类
 python基础之pycharm安装
 python基础之windows环境下安装python2和python3
数据类型之字符串（string）
数据类型之布尔值（bool/boolen）
pycharm自动生成头部代码
 数据类型之整型(int)
python基础篇之数据类型
 jquery事件绑定

原文地址：https://www.cnblogs.com/gaoyaguo/p/14312463.html

Windows下音视频对讲演示程序（声学回音消除、噪音抑制、语音活动检测、自动增益控制、自适应抖动缓冲）（2021年11月10日更新）

Windows下音视频对讲演示程序

必读说明

简介

本软件根据《道德经》为核心思想而设计，实现了两个设备之间通过TCP或UDP协议进行全双工实时音视频对讲，并做了以下增强处理：

支持8000Hz、16000Hz、32000Hz、48000Hz的音频。

支持声学回音消除，通过本人自己设计的音频输入输出帧同步方法、自适应设置回音延迟方法、三重声学回音消除器，声学回音可以消除到99%以上，还可以消除同一房间回音，且收敛时间很短，无论网络如何抖动都可以消除。

支持噪音抑制，对常见的底噪音、嘈杂的街道音、风吹音、等都有抑制效果。

支持语音活动检测，只有在人说话时才发送网络数据，无人说话时不产生网络数据，从而降低噪音、降低网络流量。

支持自动增益控制，当人说话声音较小时会自动增大音量，当人说话声音较大时会自动减小音量。

支持音频编解码，对音频数据的压缩率在1~20%之间，且支持动态比特率，从而大幅度降低网络流量，还支持数据包丢失隐藏，当网络丢包率高达30%时，仍然可以进行对讲。

支持视频编解码，支持指定比特率，最低到10KB/s仍然可以进行视频对讲。

支持音视频自适应抖动缓冲，当网络存在丢包、乱序、延时等抖动情况时，通过自适应调节缓冲深度来应对这些抖动。

支持与Android下音视频对讲演示程序进行全双工实时音视频对讲。

声学回音消除器效果对比：

准备

准备两台安装了Windows XP及以上系统的设备（已适配到Windows 10），其中一台设备作为客户端可以连接到另一台作为服务端的设备（可以用Ping工具测试，建议两台设备在同一局域网内），且两台设备都安装相同版本的本软件。

开始

在一台设备上直接点击创建服务端，再在另一台设备上将IP地址改为服务端设备的IP地址，并点击连接服务端，即可开始对讲，在任意一端点击中断，即可中断对讲。

设置按钮提供了各项功能的参数设置，绝大部分情况下都不需要修改，当然你也可以根据需要自行修改。

移植

如果有不需要的部分功能，则只需要删除该功能对应头文件和库文件，然后修改MediaProcThread.h、MediaProcThread.cpp文件即可。

高级收费功能包括：Speex声学回音消除器、WebRtc浮点版声学回音消除器、SpeexWebRtc三重声学回音消除器、RNNoise噪音抑制器、OpenH264编解码器、自己设计的自适应抖动缓冲器。

注意

从老版本更新到新版本时，类文件和库文件全部都要更新，不能只更新类文件或库文件，否则会导致意想不到的问题。

如果要使用8000Hz采样频率时，最好不要使用RNNoise噪音抑制，因为它对8000Hz的声音抑制非常强烈。

本软件不支持音乐，尤其是RNNoise噪音抑制器可能对音乐的抑制非常强烈。

某些Windows设备的软硬件环境可能存在问题，从而可能会导致声学回音消除失败，这种情况必须要先解决这些问题。

其他

本软件采用了Speex的1.2.0版本、SpeexDsp的1.2.0版本、WebRtc的2019年7月份版本、OpenH264的2021年3月份版本为基础，并进行了大量优化。

讨论QQ群：511046632 欢迎大家参与测试和讨论！

本人QQ号：280604597 赤勇玄心行天道

本人博客：http://www.cnblogs.com/gaoyaguo

Windows版源代码：https://github.com/cyz7758520/Windows_audio_talkback_demo_program

https://gitee.com/chen_yi_ze/Windows_audio_talkback_demo_program

Android版源代码：https://github.com/cyz7758520/Android_audio_talkback_demo_program

https://gitee.com/chen_yi_ze/Android_audio_talkback_demo_program

版权

Speex：https://gitlab.xiph.org/xiph/speex/-/blob/master/COPYING

WebRtc：https://gitlab.com/webrtc-mirror/webrtc/-/blob/master/LICENSE

RNNoise：https://gitlab.xiph.org/xiph/rnnoise/-/blob/master/COPYING

OpenH264：https://github.com/cisco/openh264/blob/master/LICENSE

LibYUV：https://github.com/lemenkov/libyuv/blob/master/LICENSE

感谢

感谢 WELEN、善书、陈国福 对 Speex、WebRTC 的指点！

感谢 WELEN、善书、陈国福对 Speex、WebRTC 的指点！