zoukankan      html  css  js  c++  java
  • 科大讯飞语音识别

    科大讯飞语音识别

        随着当今社会的高速发展,我们所使用的产品也向着遍历和智能的方面发展着,当然了手机端的App也不例外。现在的App都在缩减用户操作的流程,优化用户的体验,为了更加便利用户。提高用户的DAU(日活),增加用户的粘性一般我们都会想出比较新颖的招式。

        如果现在有这样一个需求:用户需求:用户需要绑定银行卡输入银行卡号,手动输入增加用户的操作度,所以用户可以通过语音读取银行卡号码,是不是既方便又只 能,现在做语音识别的有一些不错的开放平台供我们使用,一家是科大讯飞平台,一家是百度语音平台。我个人比较偏爱科大讯飞,因为科大讯飞的优势在于大段大 段的文字识别上,准确率较高。这正好能符合我输入银行卡号码准确无误的需求。这篇博客也主要讲的是是讯飞语音SDK的使用。下面我们详细看一下科大讯飞。

    1.科大讯飞开放平台

    2.科大讯飞iOS-API开放平台

    第一步:申请账号ID

    登录到讯飞开放平台上,在用户菜单栏里创建应用,这里的登录也可以采用第三方方式,在创建应用的界面填写相关的信息即可,然后就会有一个SDK的下载链接,,如果没有直接去SDK选项下载即可。

    第二步:导入讯飞SDK框架

    下载下来SDK解压后有三个文件夹:doc文件夹:不用多说肯定是开发文档;重要的是接下来的那两个文件夹:一个是lib文件夹:存放科大讯飞SDK类库,这就是我们要导入的SDK;一个是sample的科大讯飞demo演示工程。

    下面我们创建一个工程,将lib文件夹下的"iflyMSC.framework"拷贝到工程目录,然后在工程中添加依赖库,如下图所示:

     

    第三步:开始进行语音识别了

    语音识别分两种,分别用在不同场合,一个是界面提示的语音识别,一个是无界面提示的语音识别,这里以有界面提示的语音识别为例先进性讲解。

    3.1导入头文件

    3.2登录讯飞服务器

    在使用讯飞的语音解析之前,需要进行用户身份验证,即登录讯飞服务器,这个在viewDidLoad()方法中添加两行代码即可,即讯飞服务器需要根据你当前用户的APPID才能同意你登录。代码如下:

    3.3创建有界面提示语音识别对象

    3.4初始化带界面的识别对象

    3.5实现代理方法

    3.6触发开始识别语音

    在插座按钮事件中实现的识别:beginRecongnizedAction:

  • 相关阅读:
    android stagefright awesomeplayer 分析
    stagefright框架(七)-Audio和Video的同步
    stagefright框架(六)-Audio Playback的流程
    Windows Sockets Error Codes
    编译boost (windows msvc14)
    golang windows程序获取管理员权限(UAC ) via gocn
    阿里云容器服务--配置自定义路由服务应对DDOS攻击
    store / cache 系列
    一些项目感悟
    protobuf-3.0.0-beta-2 windows编译 x64/x86
  • 原文地址:https://www.cnblogs.com/dongbaoyue/p/5557337.html
Copyright © 2011-2022 走看看