zoukankan      html  css  js  c++  java
  • Android 开发 框架系列 百度语音合成

    官方文档:http://ai.baidu.com/docs#/TTS-Android-SDK/6d5d6899

    官方百度语音合成控制台:https://cloud.baidu.com/product/speech/tts

    步骤一  申请授权

    在百度语音控制台中申请使用语音合成的授权,填入相关数据后(注意:一定要选择Android填入正确的包名,不然可能会影响使用离线语音合成)。得到相应的APP_ID,APP_KEY,SECRET_KEY;然后在下载语音包SDK。

    步骤二  导入依赖

    这里有三组文件需要分别存放到指定目录(这些文件在语音包的sdk里都有):

    第一 libs里的jar

    请将这个jar导入libs文件夹里

    第二 assets里的离线语音包dat与离线文字识别dat文件

    注意这5个文件在代码里还要进行复制操作,将这些文件复制到外部存储的指定目录才能正常使用。

    第三 jniLibs里的语音合成os文件

    步骤三 个人的封装

    使用方法可以参考百度,也可以参考我这个封装,但是请要多调试。因为百度的sdk经常变动,有时效性的。

    接口class

    /**
     *@content:百度语音合成的接口class
     *@time:2018-9-10
     *@build:
     */
    
    public interface SpeechListener {
        void onInitFinish();
        void onStart(Context context,String resultValue);
        void onProgress(Context context,String resultValue,int current);
        void onFinish(Context context,String resultValue);
        void onError(Context context,String resultValue, SpeechError speechError);
    }

    配置信息class

    /**
     *@content:百度语音合成的数据管理class
     *@time:2018-9-8
     *@build:
     */
    
    public class VoiceConfigData {
        /**
         * 账号组
         */
        public static final String APP_ID = "请输入你的app id";
        public static final String APP_KEY =  "请输入你的app key";
        public static final String SECRET_KEY = "请输入你的 secret key";
        /**
         * 模式   TtsMode.MIX; 离在线融合,在线优先; TtsMode.ONLINE 纯在线; 没有纯离线
         */
        public static final TtsMode TTS_MODE = TtsMode.MIX;
    
        /**
         *离线资源文件名称与离线资源转存路径
         */
        public static final String TEMP_DIR = Environment.getExternalStorageDirectory() +"/"+"baiduTTS";//转存路径
        //离线度丫丫
        public static final String OFFLINE_FILE_ONE = "bd_etts_common_speech_as_mand_eng_high_am_v3.0.0_20170516.dat";
        //离线女声
        public static final String OFFLINE_FILE_TWO = "bd_etts_common_speech_f7_mand_eng_high_am-mix_v3.0.0_20170512.dat";
        //离线男声
        public static final String OFFLINE_FILE_THREE = "bd_etts_common_speech_m15_mand_eng_high_am-mix_v3.0.0_20170505.dat";
        //yyjw 度逍遥
        public static final String OFFLINE_FILE_FOUR = "bd_etts_common_speech_yyjw_mand_eng_high_am-mix_v3.0.0_20170512.dat";
        //离线文字识别文件
        public static final String TEXT_FILENAME = "bd_etts_text.dat";
    }

    百度语音合成工具class

    package com.yt.owl.utils.BaiduVoiceUtil;
    
    import android.content.Context;
    import android.media.AudioManager;
    import android.util.Log;
    import android.util.Pair;
    
    import com.baidu.tts.auth.AuthInfo;
    import com.baidu.tts.chainofresponsibility.logger.LoggerProxy;
    import com.baidu.tts.client.SpeechError;
    import com.baidu.tts.client.SpeechSynthesizeBag;
    import com.baidu.tts.client.SpeechSynthesizer;
    import com.baidu.tts.client.SpeechSynthesizerListener;
    
    import com.yt.owl.utils.FileHandleUtil;
    
    import java.util.ArrayList;
    import java.util.List;
    
    /**
     *@content:百度语音合成工具class
     *@time:2018-9-10
     *@build:
     * 使用说明:先使用getI方法得到单例,在使用init方法初始化,初始化完成后在调用语音合成等等方法。
     * 最后注意!请不要忘记了使用Destroy方法释放资源
     */
    public class SpeakVoiceUtil {
        private static final String TAG = "SpeakVoiceUtil";
        private SpeechSynthesizer mSpeechSynthesizer;
        private Context mContext;
        private static SpeakVoiceUtil mSpeakVoiceUtil;
        private SpeechListener mSpeechListener;
        private SpeechSynthesizerListener mSpeechSynthesizerListener;
        private SpeakVoiceUtil(){}
    
        public static SpeakVoiceUtil getI(){
            if (mSpeakVoiceUtil == null){
                mSpeakVoiceUtil = new SpeakVoiceUtil();
            }
            return mSpeakVoiceUtil;
        }
    
        /**
         * 初始化
         * @param context 外部上下文
         */
        public void init(Context context){
            this.mContext = context;
            if (mSpeakVoiceUtil == null){
                Log.e(TAG, "Error SpeakVoiceUtil is null");
                return;
            }
            initFile();
            initTTs();
            checkAuth();
            if (mSpeechListener !=null) {
                mSpeechListener.onInitFinish();
            }
        }
    
        /**
         * 合成语音并且播放
         * @param text 要合成的text文本
         */
        public void speak(String text){
            if (mSpeechSynthesizer == null) {
                Log.e(TAG, "Error speak:mSpeechSynthesizer is null.");
                return;
            }
            int result = mSpeechSynthesizer.speak(text);
            checkResult(result, "speak");
            Log.i(TAG, "播放语音:"+text);
        }
    
        /**
         * 停止语音合成和播放,清空列队
         */
        public void stop() {
            if(mSpeechSynthesizer == null){
                Log.e(TAG, "Error stop:mSpeechSynthesizer is null.");
                return;
            }
            int result = mSpeechSynthesizer.stop();
            checkResult(result, "stop");
            Log.i(TAG, "停止语音");
        }
    
        /**
         * 暂停播放。仅调用speak后生效
         */
        public void pause() {
            if(mSpeechSynthesizer == null){
                Log.e(TAG, "Error pause:mSpeechSynthesizer is null.");
                return;
            }
            int result = mSpeechSynthesizer.pause();
            checkResult(result, "pause");
            Log.i(TAG, "暂停语音");
        }
    
        /**
         * 继续播放。仅调用speak后生效,调用pause生效
         */
        public void resume() {
            if(mSpeechSynthesizer == null){
                Log.e(TAG, "Error resume:mSpeechSynthesizer is null.");
                return;
            }
            int result = mSpeechSynthesizer.resume();
            checkResult(result, "resume");
            Log.i(TAG, "恢复语音");
        }
    
        /**
         * 批量播放
         *
         * 使用demo
         * List<SpeechSynthesizeBag> list = new ArrayList<>();
         * SpeechSynthesizeBag s1 = new SpeechSynthesizeBag();
         * s1.setText("开始批量播放");
         * s1.setUtteranceId("1");
         * list.add(s1);
         * SpeechSynthesizeBag s2 = new SpeechSynthesizeBag();
         * s2.setText("批量播放成功");
         * s2.setUtteranceId("2");
         * list.add(s2);
         * SpeakVoiceUtil.getI().batchSpeak(list);
         */
        public void batchSpeak(List<SpeechSynthesizeBag> list) {
            if(mSpeechSynthesizer == null){
                Log.e(TAG, "Error batchSpeak:mSpeechSynthesizer is null.");
                return;
            }
            int result = mSpeechSynthesizer.batchSpeak(list);
            checkResult(result, "batchSpeak");
        }
    
        /**
         * 释放资源
         */
        public void Destroy() {
            if (mSpeechSynthesizer != null) {
                mSpeechSynthesizer.stop();
                mSpeechSynthesizer.release();
                mSpeechSynthesizer = null;
            }
        }
    
    
        public int setVoice(float leftVoice,float rightVoice){
            if (mSpeechSynthesizer == null){
                Log.e(TAG, "Error setVoice: mSpeechSynthesizer is null");
                return -1;
            }
            int result = mSpeechSynthesizer.setStereoVolume(leftVoice,rightVoice);
            return result;
    
        }
    
        /**
         * 语音播放监听接口回调
         * @param SpeechListener 接口类
         */
        public void onSpeechListener(SpeechListener SpeechListener){
            this.mSpeechListener = SpeechListener;
    
        }
    
    
        /**
         * 初始化语音参数
         */
        private void initTTs(){
            LoggerProxy.printable(true); // 日志打印在logcat中
            mSpeechSynthesizer = SpeechSynthesizer.getInstance();
            mSpeechSynthesizer.setContext(mContext);
            getSpeechSynthesizerListener();
            mSpeechSynthesizer.setSpeechSynthesizerListener(mSpeechSynthesizerListener);
            int result =  mSpeechSynthesizer.setAppId(VoiceConfigData.APP_ID);
            checkResult(result,"setAppId");//检查结果
            result = mSpeechSynthesizer.setApiKey(VoiceConfigData.APP_KEY,VoiceConfigData.SECRET_KEY);
            checkResult(result,"setApiKey");
    
            mSpeechSynthesizer.auth(VoiceConfigData.TTS_MODE);
            // 文本模型文件路径 (离线引擎使用), 注意TEXT_FILENAME必须存在并且可读
            mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_TTS_TEXT_MODEL_FILE,
                    VoiceConfigData.TEMP_DIR+"/"+VoiceConfigData.TEXT_FILENAME);
            // 声学模型文件路径 (离线引擎使用), 注意TEXT_FILENAME必须存在并且可读
            mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_TTS_SPEECH_MODEL_FILE,
                    VoiceConfigData.TEMP_DIR+"/"+VoiceConfigData.OFFLINE_FILE_TWO);
            // 以下setParam 参数选填。不填写则默认值生效
            // 设置在线发声音人: 0 普通女声(默认) 1 普通男声 2 特别男声 3 情感男声<度逍遥> 4 情感儿童声<度丫丫>
            mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_SPEAKER, "0");
            // 设置合成的音量,0-9 ,默认 5
            mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_VOLUME, "5");
            // 设置合成的语速,0-9 ,默认 5
            mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_SPEED, "5");
            // 设置合成的语调,0-9 ,默认 5
            mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_PITCH, "5");
    
            // 设置参数的组合模式
            // 该参数设置为TtsMode.MIX生效。即纯在线模式不生效。
            // MIX_MODE_DEFAULT 默认 ,wifi状态下使用在线,非wifi离线。在线状态下,请求超时6s自动转离线
            // MIX_MODE_HIGH_SPEED_SYNTHESIZE_WIFI wifi状态下使用在线,非wifi离线。在线状态下, 请求超时1.2s自动转离线
            // MIX_MODE_HIGH_SPEED_NETWORK , 3G 4G wifi状态下使用在线,其它状态离线。在线状态下,请求超时1.2s自动转离线
            // MIX_MODE_HIGH_SPEED_SYNTHESIZE, 2G 3G 4G wifi状态下使用在线,其它状态离线。在线状态下,请求超时1.2s自动转离线
            mSpeechSynthesizer.setParam(SpeechSynthesizer.PARAM_MIX_MODE, SpeechSynthesizer.MIX_MODE_DEFAULT);
    
            mSpeechSynthesizer.setAudioStreamType(AudioManager.MODE_IN_CALL);//设置音频流出口
            mSpeechSynthesizer.setStereoVolume(1f,1f);//设置音量
    
    
            result = mSpeechSynthesizer.initTts(VoiceConfigData.TTS_MODE);//初始化在线模式:TtsMode.MIX; 离在线融合,在线优先; TtsMode.ONLINE 纯在线; 没有纯离线
            checkResult(result, "initTts");
    
        }
    
        /**
         * 初始化文件,将assets目录的离线语音包复制到sd卡中
         */
        private void initFile(){
            Log.i(TAG, "开始初始化离线文件");
            String [] files = {VoiceConfigData.OFFLINE_FILE_ONE,
                    VoiceConfigData.OFFLINE_FILE_TWO,
                    VoiceConfigData.OFFLINE_FILE_THREE,
                    VoiceConfigData.OFFLINE_FILE_FOUR,
                    VoiceConfigData.TEXT_FILENAME};
            if (FileHandleUtil.isCanUseSD()){//判断sd卡是否可用
                for (String file : files){
                    String filePath = VoiceConfigData.TEMP_DIR+"/"+file;
                    if (!FileHandleUtil.isFileExist(filePath)){
                        Log.i(TAG, "initFile 准备复制文件file:"+file+" 到指定目录:"+filePath);
                        FileHandleUtil.copyFromAssetsToSdcard(mContext,file,VoiceConfigData.TEMP_DIR);
                    }else {
                        Log.i(TAG, "initFile "+file+"文件存在不需要复制");
                    }
                }
            }else {
                Log.e(TAG, "sdcard is null ...");
                return;
            }
        }
    
        private void checkResult(int result, String method) {
            if (result != 0) {
                Log.e(TAG, "error code :" + result + "   method:" + method + ", 错误码文档:http://yuyin.baidu.com/docs/tts/122");
            }
        }
    
        /**
         * 检查appId ak sk 是否填写正确,另外检查官网应用内设置的包名是否与运行时的包名一致。本demo的包名定义在build.gradle文件中
         *
         * @return
         */
        private boolean checkAuth() {
            AuthInfo authInfo = mSpeechSynthesizer.auth(VoiceConfigData.TTS_MODE);
            if (!authInfo.isSuccess()) {
                // 离线授权需要网站上的应用填写包名。本demo的包名是com.baidu.tts.sample,定义在build.gradle中
                String errorMsg = authInfo.getTtsError().getDetailMessage();
                Log.e(TAG, "error 鉴权失败 errorMsg=" + errorMsg);
                return false;
            } else {
                Log.e(TAG, "验证通过,离线正式授权文件存在" );
                return true;
            }
        }
    
        /**
         * 语音合成监听接口回调方法
         */
        private void getSpeechSynthesizerListener(){
            if (mSpeechSynthesizerListener == null) {
                Log.e(TAG, "初始化SpeechSynthesizerListener");
                mSpeechSynthesizerListener = new SpeechSynthesizerListener() {
                    @Override
                    public void onSynthesizeStart(String s) {
                        Log.i(TAG, "onSynthesizeStart合成启动:返回码=" + s);
    
                    }
    
                    @Override
                    public void onSynthesizeDataArrived(String s, byte[] bytes, int i) {
                        Log.i(TAG, "onSynthesizeDataArrived合成数据到达:" + "返回码=" + s + "; 字节=" + bytes + "; current=" + i);
    
                    }
    
                    @Override
                    public void onSynthesizeFinish(String s) {
                        Log.i(TAG, "onSynthesizeFinish合成完成:返回码=" + s);
    
                    }
    
                    @Override
                    public void onSpeechStart(String s) {
                        Log.i(TAG, "onSpeechStart语音开始:返回码=" + s);
                        if (mSpeechListener != null) {
                            mSpeechListener.onStart(mContext, s);
                        }
    
                    }
    
                    @Override
                    public void onSpeechProgressChanged(String s, int i) {
                        Log.i(TAG, "onSpeechProgressChanged语音播放中:返回码=" + s + "; current=" + i);
                        if (mSpeechListener != null) {
                            mSpeechListener.onProgress(mContext, s, i);
                        }
    
                    }
    
                    @Override
                    public void onSpeechFinish(String s) {
                        Log.i(TAG, "onSpeechFinish语音播放结束:返回码=" + s);
                        if (mSpeechListener != null) {
                            mSpeechListener.onFinish(mContext, s);
                        }
    
                    }
    
                    @Override
                    public void onError(String s, SpeechError speechError) {
                        Log.e(TAG, "onError异常:返回码=" + s + "; SpeechError=" + speechError);
                        if (mSpeechListener != null) {
                            mSpeechListener.onError(mContext, s, speechError);
                        }
    
                    }
                };
            }
        }
    }

     另外还有一些复制文件的的简单方法,我就不贴出来了。可以自行编写方法用于复制文件

  • 相关阅读:
    poj2346
    poj3748
    poj1205
    PostThreadMessage 使用注意问题
    CBitmap Detach DeleteObject关系
    音视频编码技术与格式大全
    利用 DirectShow 开发自己的 Filter
    VC+DirectShow对视频进行图片处理VC教程电脑教程之家.htm
    Directx报错01
    深圳超多维光电子有限公司
  • 原文地址:https://www.cnblogs.com/guanxinjing/p/9708573.html
Copyright © 2011-2022 走看看