zoukankan      html  css  js  c++  java
  • (一)准备训练语音文件

    1、安装音频录放工具“sox”:

    "sox"主要包含两个命令,后续将会用到:rec(录音)和play(播放)。

    sudo apt-get install sox

    2、创建目录树:

    为了有序组织各种中间文件,在创建如图所示目录树:

    mkdir -p htk_color/{config,data/{test/{mfc,speech},train/{mfc,speech}},dict,hmm0,hmm1,hmm2,hmm3,hmm4,hmm5,hmm6,hmm7,labels,lists,results,scripts}



    3、录制“训练语音文件”:

    cd htk_color;(注:之后的所有命令都在此目录下执行

    录制音频文件01.wav~50.wave,并置于data/train/speech/目录中(按CTRL-C结束录音),

    rec -b 8 data/train/speech/01.wav

    rec -b 8 data/train/speech/02.wav

    ……

    rec -b 8 data/train/speech/50.wav

    录音的内容为:“RED"或"YELLOW"或"BLUE",总共要50个,以下给了个清单,以供参考(请按顺序录制):

    (请将此清单保存至"labels"目录下,并且命名为"trainprompts")

    BLUE
    RED
    BLUE
    BLUE
    BLUE
    YELLOW
    RED
    BLUE
    BLUE
    RED
    YELLOW
    YELLOW
    BLUE
    BLUE
    RED
    BLUE
    BLUE
    YELLOW
    YELLOW
    BLUE
    RED
    BLUE
    BLUE
    BLUE
    RED
    BLUE
    YELLOW
    BLUE
    BLUE
    BLUE
    YELLOW
    RED
    YELLOW
    YELLOW
    YELLOW
    BLUE
    BLUE
    RED
    RED
    RED
    RED
    BLUE
    YELLOW
    RED
    BLUE
    BLUE
    BLUE
    BLUE
    BLUE
    YELLOW

    4、录音试听(可选):

    试听一下有没有一走神录错了的:

    play data/train/speech/01.wav

    play data/train/speech/02.wav

    ……

    在一个阳光明媚的下午,因为害怕打扰到室友睡觉,我躲在月黑风高的厕所,带着满满的厕所味,英勇的录制了这50个训练音频

    以供参考(建议自行录制,以便测试时达到最好效果,毕竟最后识别的是你的声音,除非你的声音和我一样有“魅力”):

    HTK Book涉及内容:

    Chapter 3: 3.1.3 Step 3 - Recording the Data

  • 相关阅读:
    Hdu1711 Number Sequence--Kmp模板题
    Trie入门--Poj3630 Phone List,查单词,HDU1251 统计前缀,PKU2503 Babelfish
    高次幂的组合数表示形式
    BZOJ1697 [Usaco2007 Feb] Cow Sorting牛排序
    1025 [SCOI2009]游戏(置换群,DP)
    Poj1721 Cards
    [Poi2003]Shuffle
    poj 3128 Leonardo's Notebook(置换的幂)
    POJ3734 Block母函数入门
    重心拉格朗日插值法
  • 原文地址:https://www.cnblogs.com/ansersion/p/4155951.html
Copyright © 2011-2022 走看看