zoukankan      html  css  js  c++  java
  • python语音识别入门及实践

    单。阅读本指南,你就将会了解。你将学到:

    •语音识别的工作原理;

    •PyPI 支持哪些软件包; 

    •如何安装和使用 SpeechRecognition 软件包——一个功能全面且易于使用的 Python 语音识别库。

    选择 Python 语音识别包

    PyPI中有一些现成的语音识别软件包。其中包括:

    •apiai

    •google-cloud-speech

    •pocketsphinx

    •SpeechRcognition

    •watson-developer-cloud

    •wit

    一些软件包(如 wit 和 apiai )提供了一些超出基本语音识别的内置功能,如识别讲话者意图的自然语言处理功能。其他软件包,如谷歌云语音,则专注于语音向文本的转换。

    其中,SpeechRecognition 就因便于使用脱颖而出。

    识别语音需要输入音频,而在 SpeechRecognition 中检索音频输入是非常简单的,它无需构建访问麦克风和从头开始处理音频文件的脚本,只需几分钟即可自动完成检索并运行。

     SpeechRecognition 库可满足几种主流语音 API ,因此灵活性极高。其中 Google Web Speech API 支持硬编码到 SpeechRecognition 库中的默认 API 密钥,无需注册就可使用。SpeechRecognition 以其灵活性和易用性成为编写 Python 程序的最佳选择。

    pip install SpeechRecognition
    

      安装完成后请打开解释器窗口并输入以下内容来验证安装:

    import speech_recognition as sr
    >>> sr.__version__
    '3.8.1'
    

      

    注:不要关闭此会话,在后几个步骤中你将要使用它。

    若处理现有的音频文件,只需直接调用 SpeechRecognition ,注意具体的用例的一些依赖关系。同时注意,安装 PyAudio 包来获取麦克风输入。

  • 相关阅读:
    [算法][递归] 整数划分 种类数
    [C++] 行程编码C++代码
    Integer IntegerCache源码
    mysql中函数greatest 与MAX区别
    mysql least函数
    easyui icon的使用相关
    jQueryEasyUI Messager基本使用
    EasyUI 修改 Messager 消息框大小
    静态代理和动态代理的区别
    table合并单元格colspan和rowspan
  • 原文地址:https://www.cnblogs.com/huaobin/p/15677059.html
Copyright © 2011-2022 走看看