zoukankan      html  css  js  c++  java
  • 使用最新的“huihui中文语音库”实现文本转语音功能

    最近一个web项目中,需要进行语音播报,将动态的文字转换为语音(TTS)存为WAV文件后通过web播放给用户。选择了微软所提供的SAPI (The Microsoft Speech API),只需要几行代码即可实现。主要的问题是选择一个好的中文语音库,让播放的声音更贴近真人。各个中文版操作系统自带的中文语音包如下(通过控制面板语音属性进行查看):

    Windows 2000/XP/Vista:无

    Windows 7中文版、Windows 2008中文版:Microsoft lili

    Windows 8中文版、Windows 2012中文版:Microsoft Huihui Desktop

    另外,还有很多厂商推出了自己的语音包,也有不少中文的,通过对比,发现Win8中文版开始提供的"Microsoft Huihui Desktop”(以下简称桌面版Huihui)效果最好。如果发布的web服务器是win8中文版或者server2012中文版,则可以直接通过代码使用这个语音包,但是对于其他操作系统或者是非中文的操作系统,想要使用这个语音包,就有不少问题了。主要有三个问题:

    1.没有现成的语音包

    实际上,微软并没有提供独立语音库下载安装,也就是说,并没有桌面版Huihui的语音包供安装。

    解决方法:微软在另一套语音引擎中(Microsoft Speech Platform),也提供了很多语音包,其中一个"Microsoft Server Speech Text to Speech Voice (zh-CN, HuiHui)”(以下简称服务器版Huihui),这其实和桌面版Huihui在发音方面,完全一致(下载Microsoft Speech Platform - Runtime Languages (Version 11)其中的MSSpeech_TTS_zh-CN_HuiHui.msi安装即可)。可以使用这个语音包,来实现桌面版Huihui的播放效果。

    注意:这个安装包执行一下就消失了,没有需要用户交互的操作界面,不用担心,已经安装好了。

    2.语音引擎不一致

    语音播放需要语音引擎的支持。实际上微软的语音引擎系统已经发展了好几代,从SAPI4、SAPI5(最后一版是5.4)发展到目前的Microsoft Speech Platform 11。对于SAPI,Windows XP内置了 TTS 语音引擎SAPI5.1,Vista、Server 2008内置SAPI5.3,Win7内置SAPI5.4,无需安装。而Microsoft Speech Platform 11目前没有内置于操作系统,需要下载Microsoft Speech Platform - Runtime (Version 11)安装来支持语音包,注意里面有x86和x64版,应该根据服务器的操作系统版本来确定安装。

    3.修改注册表

    实际上通过上述两个步骤安装语音引擎和语音包,有两个问题:一是无法在控制面板中看到安装好的语音包(32位系统C:WindowsSystem32SpeechSpeechUXsapi.cpl,64位系统通过C:WindowsSysWOW64SpeechSpeechUXsapi.cpl才能看到),二是使用SAPI的GetVoices()方法,也获取不到这个语音包,也就无法继续执行转换语音的功能。

    这里的主要问题是这个语音包是供Microsoft Speech Platform 11使用的,其语音包的注册信息,和SAPI支持的语音包注册信息不在一个位置(主要是注册表信息),导致了控制面板和SAPI的代码无法获取到它支持的语音。查阅了很多国外的资料,发现可以通过修改注册表或修改服务器版Huihui语音包的安装程序来解决这个问题。

    修改注册表法:

    如果已经安装了原版服务器版Huihui,进入注册表,将

    • HKEY_LOCAL_MACHINESOFTWAREMicrosoftSpeech Server
    • HKEY_LOCAL_MACHINESOFTWAREWow6432NodeMicrosoftSpeech Server

    导出。然后用记事本打开这两个注册表文件,

    • 将全部“Speech Serverv11.0”替换为“Speech”
    • 将全部“Speech Server\v11.0”替换为“Speech”

    保存后,导入到注册表,如果提示错误,也没关系。

    注意:32位系统只有第一个注册表位置。64位系统全都需要导出。

    修改安装包法:

    (1)安装orca软件

    这是一个修改安装程序(msi)的软件。下载安装好后打开软件即可。

    (2)修改语音包

    orca-file-open,打开原版语音包,定位到Tables的Registry,如下图,将所有Speech Serverv11.0修改为Speech,然后File-Save即可。保存后的就是需改的语音包。

    image

    我修改好了一个,提供了下载

     

    总结:

    安装语音引擎Microsoft Speech Platform 11。

    安装修改好的语音包MSSpeech_TTS_zh-CN_HuiHui.msi/或安装原版语音包然后修改注册表。

    本文只介绍如果用SAPI引擎(命名空间System.Speech)来利用最新语音库,实际上,Microsoft Speech Platform 11这个语音引擎(命名空间Microsoft.Speech)具有更加强大的功能,比如支持VoiceXML,详细可参考

    参考:

    TTS正确使用Microsoft Speech Platform 11发音朗读的方法

    http://www.xqbase.com/xqwizard/help_tts.htm

  • 相关阅读:
    设计模式(六)Prototype Pattern 原型模式
    设计模式(五)Builder Pattern建造者模式
    Linux安装软件
    日志技术及JUL入门
    IDEA推出新字体,极度舒适
    HDFS的API操作
    Apollo的灰度发布
    Apollo整合SpringBoot开发
    Apollo配置发布原理
    Apollo应用配置
  • 原文地址:https://www.cnblogs.com/lerit/p/3486854.html
Copyright © 2011-2022 走看看