zoukankan      html  css  js  c++  java
  • ISD9160学习笔记05_ISD9160语音识别代码分析

    前言

    语音识别是特别酷的功能,ISD9160的核心卖点就是这个语音识别,使用了Cybron VR 算法。 
    很好奇这颗10块钱以内的IC是如何实现人家百来块钱的方案。且听如下分析。

    本文作者twowinter,转载请注明:http://blog.csdn.net/iotisan/

    功能分析

    语音识别例程中做了21条语音识别模型,只要识别到对应的语音,就从串口输出对应模型的命令ID。

    具体21条命令如下: 
    全开模式 0 显示为1 
    外出模式 1 显示为2 
    房间开启 2 。。。 
    房间关闭 3 
    单灯变色 4 
    多灯变色 5 
    全部变色 6 
    打开开关 7 
    关闭开关 8 
    打开插座 9 
    关闭插座 10 
    我要开灯 11 
    我要关灯 12 
    打开空调 13 
    关闭空调 14 
    温度升高 15 
    温度降低 16 
    打开电视 17 
    关闭电视 18 
    更换频道 19 
    降低音量 20 
    增加音量 21

    代码分析

    代码主循环的逻辑特别清晰,我把主干抽出来,方便大家理解。

    int32_t DoVR_sep()
    {
        Wave_StartRecord();
        CSpotter_Reset(hCSpotter);
    
        while (1) {
            nNumSample = Wave_GetSample(&lpsSample);
    
            if (CSpotter_AddSample(hCSpotter, lpsSample, nNumSample) == CSPOTTER_SUCCESS){
                nID = CSpotter_GetResult(hCSpotter);
                DrvUART_Write(UART_PORT0,&nID,1);       //confid 20150603
            }
            Wave_UnlockSample(&lpsSample);
        }
    }

    Wave_StartRecord开始录音,Wave_GetSample取出音频数据。 
    CSpotter_AddSample进行语音识别,CSpotter_GetResult识别出语音命令ID,最后DrvUART_Write吐出ID。

    如何修改自定义语音命令

    原定计划是修改自定义语音命令,但是发现这块资料很少。对于如何实现语音识别的Cybron VR算法,这块是封装成库,具体是“CSpotterSDK16k24d.lib”。这部分底层核心不开放,是可以理解。但是在具体应用时,使用什么工具来产生具体的声音模型,却一直没能找到对应工具。

    总结

    可以看到ISD9160是可以实现本地一些预置的语音命令,基本上可以比的上一些几十块钱的模块。但是如何实现自定义的语音命令,还需要继续研究。

  • 相关阅读:
    无法启动调试--未安装 Silverlight Developer 运行时。请安装一个匹配版本。
    jQuery导航菜单防刷新
    IE6下Png透明最佳解决方案(推荐) Unit PNG Fix
    每周进步要点(第50周12.4-12.11)
    学习笔记:重塑你的自我驱动力
    学习笔记之是什么决定我们的命运
    读书《万万没想到 3》
    人与人之间的鄙视链是如何形成的?
    第7本《万万没想到-用理工科思维理解世界2》
    中明写公众号的时候他在想什么
  • 原文地址:https://www.cnblogs.com/zhugeanran/p/9230063.html
Copyright © 2011-2022 走看看