usage: steps/align_si.sh <data-dir> <lang-dir> <src-dir> <align-dir>
e.g.: steps/align_si.sh data/train data/lang exp/tri1 exp/tri1_ali
对特征进行若干变换
调整模型的静音音素权重
根据词-词标识符映射表(words.txt),将标注转换为词标识符的序列:
tra="ark:utils/sym2int.pl --map-oov $oov -f 2- $lang/words.txt $sdata/JOB/text|";
构建训练图(transition model,转移模型)
H:$dir/final.mdl的转移模型部分;
C:$dir/tree;
L:$lang/L.fst;
G:"$tra";
训练图的输入是GMM的标识符序列,输出是词的标识符序列。
GMM-HMM的final.mdl包含转移模型与状态模型(其概率密度函数为混合高斯模型)。
强制对齐(Force Align)
在HCLG+GMM中对特征进行维特比搜索,得到最优结果,即Alignment(对齐) $dir/ali.JOB.gz。
HCLG+GMM的输入是特征序列,输出是词的标识符序列。