780人加入学习
(8人评价)
入门精选:从零搭建语音识别引擎 - 基于Kaldi

课程完成于2021.11.9

价格 免费

cd /$kaldi_root/egs/wsj/s5 

要在這底下執行

utils/prepare_lang.sh 

[展开全文]

查看lexicon.txt

<SIL> SIL

A EY1

BABY B EY1 B IY0

.....

 

第0項是詞 後面是音素

 

因此prepare_lang 要輸入的是'<SIL>'

而非'SIL' 

 

[展开全文]

fstdraw --isymbols=phones.txt --osymbols=words.txt L.fst > L.dot

 

dot -Tjpg L.dot > L.jpg

 

[展开全文]

L_disambig.fst 解決同音字問題

 

ex 「樹木」與「數目」

[展开全文]

B I E S

查看prepare_lang.sh 

(B)egin

(E)nd

(I)nternal

(S)ingleton

 

可以查看 temp/01_learn/lexiconp.txt

[展开全文]

/kaldi/tools/openfst/bin/fstdraw --isymbols=phones.txt --osymbols=words.txt L.fst > L.dot

[展开全文]

/kaldi/tools/openfst/bin/fstprint --isymbols=phones.txt --osymbols=words.txt L_disambig.fst

[展开全文]

軟連結 

ln -s $kaldi_root/egs/wsj/s5/utils ./utils

ln -s $kaldi_root/egs/wsj/s5/step ./step

[展开全文]

製作 nonsilence_phones.txt 

>複製一份phones 將 SIL 刪除

製作optional_silence.txt

> SIL

 

 

 

 

[展开全文]

製作phone.txt

辭典要放在 /local/dict/裡面

從 遞迴/local/dict/lexicon.txt 找全部的音素 

 

[展开全文]

聲學特徵 -> H.fst -> 音素

音素 -> L.fst(辭典) -> 詞

詞 -> G.fst -> 詞

音素 -> C.fst -> 音素

[展开全文]

檢查文件 目錄

到此目錄下/$kald_root/egs/wsj/s5/

 

輸入 utils/fix_data_dir 四個檔案的絕對路徑(wav.scp utt2spk spk2utt text)  

[展开全文]