阿里巴巴 2018 年开源的语音识别模型 DFSMN,将全球语音识别准确率纪录提高至 96.04%。DFSMN 模型,是阿里巴巴的高效工业级实现,相对于传统的 LSTM、BLSTM 等声学模型,该模型具备训练速度更快、识别更高效、识别准确率更高和模型大小压缩等效果。
本场 Chat 的主要内容包括:
- 语音识别流程简介;
- Kaldi 的部署使用;
- 如何训练基于中文的 DFSMN 声学模型;
- 语音特征提取 MFCC 算法源码解读;
- 语音识别工具对比。
https://gitbook.cn/gitchat/activity/5bcc8f9b0920511ab0ff412b