zoukankan      html  css  js  c++  java
  • kaldi运行thchs30例子

    首先,thchs30有两种数据库,kaldi运行的数据库最好是 thchs30-openslr。

    修改run.sh里面的语音库路径  thchs30=...

    修改nj线程数 等于CPU的核心数

    修改cmd.sh  queue.pl 改为run.pl本地机器跑

    运行出现错误:

    lexicon.txt验证出错

    里面binary file  matches

    这是grep的问题,grep -v -a '<s>' | grep -v -a '</s>' | sort -u > data/dict/lexicon.txt || exit 1;

    ---------------------------------------------------------------------------------------------------------------------------

    在线识别部分:

    去egs下,打开voxforge,里面有个online_demo,直接考到thchs30下。在online_demo里面建2个文件夹online-data  work,在online-data下建两个文件夹audio和models,audio下放你要回放的wav,models建个文件夹tri1,把s5下的exp下的tri1下的final.mdl和35.mdl(final.mdl是快捷方式)考过去。把s5下的exp下的tri1下的graph_word里面的words.txt,和HCLG.fst,考到models的tri1下。

     类似处理,包括tri2b,tri3b,tri4b,不过后者需要添加转移矩阵,final.mat以及所指的mat文件。

    如下所示,例如 tri2b文件夹下,

    打开online_demo的run.sh

    a)将下面这段注释掉:(这段是voxforge例子中下载现网的测试语料和识别模型的。我们测试语料自己准备,模型就是tri1了)

    if [ ! -s ${data_file}.tar.bz2 ]; then
        echo "Downloading test models and data ..."
        wget -T 10 -t 3 $data_url;


        if [ ! -s ${data_file}.tar.bz2 ]; then
            echo "Download of $data_file has failed!"
            exit 1
        fi
    fi

    b) 然后再找到如下这句,将其路径改成tri1

     # Change this to "tri2a" if you like to test using a ML-trained model
    ac_model_type=tri2b
     

    if [ -s $ac_model/final.mat ]; then
    trans_matrix=$ac_model/final.mat
    echo "set matrix"
    fi

    online-gmm-decode-faster --rt-min=0.5 --rt-max=0.7 --max-active=4000
    --beam=12.0 --acoustic-scale=0.0769 --left-context=3 --right-context=3 $ac_model/final.mdl $ac_model/HCLG.fst
    $ac_model/words.txt '1:2:3:4:5' $trans_matrix;;

    识别效果很差

  • 相关阅读:
    mysql 历史版本下载
    mysql 5.7 版本 You must reset your password using ALTER USER statement before executing this statement报错处理
    5.7 zip 版本的安装 以及遇到的坑
    mysql 5.6zip版本的卸载与5.7 zip 版本的安装
    mysql数据库的备份与还原
    本地Navicat连接docker里的mysql
    docker修改数据库密码
    docker 在push镜像到本地registry出现的500 Internal Server Error
    linux 没有界面内容显示不全解决办法
    json与map互相转换
  • 原文地址:https://www.cnblogs.com/welen/p/7543162.html
Copyright © 2011-2022 走看看