zoukankan      html  css  js  c++  java
  • 语音识别性能评估方法

    词错率(WER)

    使识别出来的词序列和标准的词序列之间保持一致,需要进行替换,删除,或者插入某些词,这些插入,替换,删除的词的总个数,除以真实词序列中词的个数的百分比,即为WER,其计算公式如下所示:

     

    例1:

    REF:真实词序列

    HYP:识别词序列

    I 插入  S 替换  D 删除

     

    字错率(CER)

    与词错率相似,以字符的识别结果为计算单位。

    实时因子(RTF)

    real time factor  :实时因子,一般在实时语音识别过程中的评价延迟标准。RTF定义为模型解码时间与输入音频持续时间的比率。

    句错率(SER)

    SER表示为句子中如果有一个词识别错误,那么这个句子被认为识别错误,计算公式如下:

     

    RT90

    即实时因素(处理时间除以音频持续时间)为90%,其中较低的值表示处理速度更快和较低的用户感知延迟

    (RT:Response Time,响应时间,执行一个请求从开始到最后收到响应数据所花费的总体时间,即从客户端发起请求到收到服务器响应结果的时间。)

  • 相关阅读:
    项目管理--PMBOK 读书笔记(4)【项目整合管理】
    数论(二)
    数论(一)
    Jmeter连接mysql数据库
    minicom工具的使用
    centos7 docker 挂载文件思路
    go语言的init函数
    go操作elasticsearch
    UML交互图
    Linux环境下mysql的安装
  • 原文地址:https://www.cnblogs.com/2016-zck/p/15759480.html
Copyright © 2011-2022 走看看