用Python来使用科大讯飞语音识别，so easy

zoukankan html css js c++ java

用Python来使用科大讯飞语音识别，so easy
在人工智能高速发展的今天，语音识别技术被带入到人们的工作和生活中，开始被越来越多的人关注和使用，今天,当各种在线客服被机器人客服代替,当速记翻译馆被语音识别代替,甚至当收银员、驾驶员、工厂工人、普通文书和律师都被人工智能代替时，人们也越来越焦虑。下面这篇文章分享Python用ctypes调用动态库的方式使用科大讯飞语音识别。

ctypes 是 Python 的一个模块，它提供了C语言相关的数据类型，可以方便的调用C语言编写的DLL（Windows 动态链接库）和so（Linux动态链接库）。科大讯飞的语音识别客户端SDK提供了Linux下的C语言SDK，却没有Python的。有了ctypes，我们就可以很轻松的用Python来使用科大讯飞的语音识别了。

通过LoadLibrary()函数加载动态库：
xflib = ctypes.cdll.LoadLibrary('msc/libmsc.so')
在Python里面调用C函数时主要是注意参数的类型。语音识别的接口的具体参数可以参考其提供的文档，比如接口函数：
const char* MSPAPI QISRSessionBegin( const char* grammarList, const char* params, int* errorCode )
返回的是一个char指针作为sessionID以供后续接口作为参数使用，在Python里面要用ctypes.c_voidp类型：
ret = ctypes.c_int() sessionId = ctypes.c_voidp() sessionId = xflib.QISRSessionBegin(None, param1, ret)
调用其它接口函数时，还可能用到如下ctypes的类型和接口：
- ctypes.create_string_buffer()
- ctypes.addressof()
- ctypes.byref()
- ctypes.string_at()
- ctypes.c_char_p()
- ctypes.c_uint()
关于ctypes的更详细说明可以参考官方文档。

文章整理于www.yuanrenxue.com
查看全文

相关阅读:
MusicXML 3.0 (7) 连线、延音线
 Castle ActiveRecord学习实践（7）：使用HQL查询
 C#中废弃一个方法小技巧
 加入BI团队，推荐一个商业智能的论坛
 .NET设计模式（13）：享元模式（Flyweight Pattern）
重载还是覆写？
Castle ActiveRecord学习实践（2）：构建配置信息
 使用WebClient上传文件时的错误问题解决
 Castle ActiveRecord学习实践（5）：实现Many–Many关系的映射
 天津.NET俱乐部成立了！

原文地址：https://www.cnblogs.com/amiza/p/10347829.html