语音识别性能评估方法 - 走看看

zoukankan html css js c++ java

语音识别性能评估方法

词错率（WER）

使识别出来的词序列和标准的词序列之间保持一致，需要进行替换，删除，或者插入某些词，这些插入，替换，删除的词的总个数，除以真实词序列中词的个数的百分比，即为WER，其计算公式如下所示：

例1：

REF：真实词序列

HYP：识别词序列

I 插入 S 替换 D 删除

字错率（CER）

与词错率相似，以字符的识别结果为计算单位。

实时因子（RTF）

real time factor ：实时因子，一般在实时语音识别过程中的评价延迟标准。RTF定义为模型解码时间与输入音频持续时间的比率。

句错率（SER）

SER表示为句子中如果有一个词识别错误，那么这个句子被认为识别错误，计算公式如下：

RT90

即实时因素（处理时间除以音频持续时间）为90%，其中较低的值表示处理速度更快和较低的用户感知延迟

（RT：Response Time，响应时间，执行一个请求从开始到最后收到响应数据所花费的总体时间，即从客户端发起请求到收到服务器响应结果的时间。）

查看全文

相关阅读:
自解压命令学习
 浅谈JAVA中的final修饰符
 clearfix清除浮动进化史
 HTML5本地存储Localstorage
Log4j详细使用教程
 AutoCompleteTextView与MultiAutoCompleteTextView应用
 冒泡排序
 方法的递归
 枚举类型
 ThinkJs笔记琐碎

原文地址：https://www.cnblogs.com/2016-zck/p/15759480.html

Copyright © 2011-2022 走看看