zoukankan      html  css  js  c++  java
  • IOS Google语音识别更新啦!!!

     
    旧版本的API:
     
    Google提供了一个在线语音识别的API接口,通过该API可以进行中文、英文等语言的识别。
     API地址:http://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=zh-CN&maxresults=1
      —参数解释: 

      xjerr:错误标准

      client: 客户端类型

      lang:待识别语言类型,en-US是英文,中文为zh-CN

      maxresults最大返回识别结果数量

    —识别基本流程:
      • 从音频输入设备获取原始音频并编码或直接调用音频文件。
      • 将音频POST至接口地址。
      • 分析处理返回的JSON并得出结果。
    —请求接口
      • 地址:如前
      • 请求方式:http post
      • 请求数据:编码后的音频数据
      • 音频编码格式:wavspeexflac
      • 音频采样频率:8000Hz11025Hz16000Hz22050Hz24000Hz32000Hz44100Hz48000Hz
    —主要优点
    语音识别引擎庞大,识别精度很高,适用于文本语音识别。提供多国语言的语音识别。
    任何平台都可以进行访问,容易使用。
    —主要缺点
    API未开放,未能获知具体开发细节。
    识别引擎位于服务器端,识别的速度和网络质量有关,识别速度较慢。
    待识别音频的格式、大小、时长的限制。
     
    新版本的API:
       
    api:地址: https://www.google.com/speech-api/v2/recognize?output=json&lang=en-us&key=yourkey
    主要说一下变化:
    URL路径: 之前的V1变成V2

    参数: 新增output:输出类型,我们一般用json
    新增KEY:需要去goole注册帐号,申请apikey,如果你不懂请google
    其他的参数都能够继续使用

    相关文档:

      谷歌官方开源代码: https://www.google.com/speech-api/v2/recognize

      谷歌开发者Key申请地址:https://console.developers.google.com

  • 相关阅读:
    后CIO人如何规划职业生涯
    数据库设计三大范式应用实例剖析
    一个女孩从软件测试工程师到主管的成长
    一本适合测试初学者阅读的中文译著
    再看微软团队文化
    阳光的测试工作历程(转载)
    hdu 2795
    hdu 2426
    hdu 2255+hdu 3395
    hdu 3729
  • 原文地址:https://www.cnblogs.com/jimfrank/p/ios.html
Copyright © 2011-2022 走看看