zoukankan      html  css  js  c++  java
  • Kaldi的英文缩写

    lang

    language,语言

    示例:data/lang

    Language directory

    bg

    binary-grammar,二阶语言模型

    示例:data/lang_test_bg_5k

    Language directory used for test, with big dictionary of 5000 words

    用于解码测试的语言目录,其字典为包含5000个单词的大字典

    tg

    triple-grammar,三阶语言模型

    示例:data/lang_test_bd_tg

    Language directory used for test, big dictionary, triple-grammar

    用于解码测试的语言目录,大字典,三阶语言模型

    fg

    four-grammar,四阶语言模型

    示例:data/lang_test_bd_fg

    Language directory used for test, big dictionary, four-grammar

    用于解码测试的语言目录,大字典,四阶语言模型

    bd

    big dict,大字典

    示例:data/lang_test_bd_tgpr

    Language directory used for test, big dictionary, pruned triple-grammar

    用于解码测试的语言目录,大字典,裁剪过的三阶语言模型

    pr

    pruned,裁剪过的

    示例:data/lang_test_tgpr_5k

    Language directory used for test, with dictionary of 5000 words, pruned triple-grammar

    用于解码测试的语言目录,其字典为包含5000个单词的大字典,裁剪过的三阶语言模型

    DAE

    Denoising Auto Encoder

    降噪自动编码器,常作为DNN的前端,用于降噪

    示例:thchs30/local/dae

    hires

    high resolution

    高分辨率,高维数,通常表示40维的MFCC特征

    示例:data/train_hires

    sp

    speed perturb,速度扰动,通常表示通过速度扰动进行增广过的数据集

    silence phone,静音音素

    nosp

    no silence phone,无静音音素,通常用于音素集中没有静音音素的语言目录

    示例:data/lang_nosp

    nodup

    no duplex,无重复的,文本无重复,通常表示已经将训练集相同标注的语句去除

    示例:data/train_nodup

    2y7d

    数字+字母形式的调优版本,字母可省略。通常出现在kaldi/egs/*/local/{nnet3,chain}/tuning目录以及相关目录中。

    a, b,..., z

    1a, 1b,..., 1z

    ...

       

    示例:

    1. swbd/s5c/local/chain/tuning/run_tdnn_blstm_a.sh

      TDNN-BLSTM的基线模型

    2. swbd/s5c/local/chain/tuning/run_tdnn_blstm_2y.sh

      TDNN-BLSTM的调优模型,版本为2y

    3. swbd/s5c/local/chain/tuning/run_tdnn_blstm_7d.sh

      TDNN-BLSTM的调优模型,版本为7d

    4. exp/chain/tri6_7d_tree

      版本为7d的调优模型所使用的决策树目录

    5. data/lang_chain_2y

      版本为2yChain调优模型所使用的语言目录

    sw1

    Switchboard 1

    因为Switchboard由多个部分组成,而kaldi/egs/swbd示例只使用了Switchboard-1 Phase 1,因此相关数据集、转录等缩写为sw1

    示例:

    1. data/lang_nosp_sw1_tg

      语言目录,不包含静音音素,其中三阶语言模型使用Switchboard 1转录训练

    2. exp/tri1/graph_nosp_sw1_tg

      解码图目录,不包含静音音素,其中三阶语言模型使用Switchboard 1转录训练

    fsh

    fisheregs/fisher_english示例及其相关数据

    示例:data/lang_fsh_sw1_tg

    语言目录,其中三阶语言模型使用fisher_englishSwitchboard 1的转录进行训练得到

    xent

    Cross Entropy,交叉熵,通常表示Chain模型的交叉熵正则化

    示例:xent_regularize=0.1,交叉熵正则化系数

    egs

    examples,示例,通常表示Kaldi脚本示例

    例如:kaldi/egs目录

       

    examples,样本,通常表示训练样本

    例如:exp/chain/tdnn_blstm_a/egs目录

       

    eg

    example,样本,通常表示训练样本

    示例:

    1. --frames-overlap-per-eg 0

      训练样本之间重叠(重复)的帧数为0

    2. --frames-per-eg 50

      一个训练样本包含50

    si

    speeker independent,说话人无关,即没有进行说话人自适应训练(SAT

    示例:steps/align_si.sh

    说话人无关的对齐

  • 相关阅读:
    react axios 跨域访问一个或多个域名
    基础复习1
    Webpack笔记
    小程序笔记下
    小程序笔记上
    webpack-dev-server的使用
    webpack资源加载常用配置
    vue实现组件切换的两种方式
    vue实现一个评论列表
    子组件调用父组件的数据及方法
  • 原文地址:https://www.cnblogs.com/JarvanWang/p/11156441.html
Copyright © 2011-2022 走看看