1、Step 1:Feature Extractionv將實驗所需的訓練音及測試音波形檔將實驗所需的訓練音及測試音波形檔(*.wav)轉換成特徵檔轉換成特徵檔(*.mfcc)1.建立一個設定檔建立一個設定檔fea_extract.cfg來指定轉換之來指定轉換之輸入與輸出格式。輸入與輸出格式。2.建立一個輸入與輸出檔路徑表檔案建立一個輸入與輸出檔路徑表檔案io_filelist.txt3.執行執行HCopy-C fea_extract.cfg-S io_filelist.txtStep 2:音檔標音並蒐集會用到的聲音單位音檔標音並蒐集會用到的聲音單位d0 ling spd1 i spd2 er sp
2、d3 san spd4 su spd5 wu spd6 liou spd7 chi spd8 ba spd9 jiou spSILENCE silv建立標音字典建立標音字典 word_to_syllable_sp.dicv本例標音字典中每個音都會用到本例標音字典中每個音都會用到v用用HLEd程式將程式將 word_trans.mlf 轉成轉成syllable_trans_sp.mlf的標音檔的標音檔編輯轉換規則檔編輯轉換規則檔dig_to_syllable.led,內容,內容含含EX及及IS sil sil執行執行HLEd -d word_to_syllable_sp.dic-i syllab
3、le_trans_sp.mlf dig_to_syllable.led word_trans.mlfword_to_syllable_sp.dic#!MLF!#mfcc/S5/00_00.labsillingspsil.mfcc/S5/00_01.labsilispsil.mfcc/S5/00_10.labsilliouspsuspsuspliouspispsanspsil.syllable_trans_sp.mlfStep 3:建立建立HMM model的架構的架構(產生初始產生初始HHM)1.造好存放初始HHM架構的目錄mkdir model_structdel/q model_struc
4、t2.系統共使用幾種架構?哪些聲音的HMM檔要使用同一種架構為每個架構建一個“架構設定檔”及“模型表列檔”注意:模型表列檔最後要有一個空白列 例 model_struct1.pcf,hmmlist1.txt 設定各數字音模型(6個狀態)model_struct2.pcf,hmmlist2.txt 設定靜音模型(3個狀態)model_struct3.pcf,hmmlist3.txt 設定短間隔音模型(1個狀態)架構設定檔內含vHMM狀態數,連接結構,v要產生哪幾個聲音的HMM檔(HMMList欄位)v產生的HMM檔要放在哪個目錄(OutDir欄位)執行產生各種架構執行產生各種架構HMM檔之指令,
5、例檔之指令,例:Perl MakeProtoHMMSet model_struct1.pcf Perl MakeProtoHMMSet model_struct2.pcf1.Perl MakeProtoHMMSet model_struct3.pcf將各個模型表列檔合併成將各個模型表列檔合併成hmmlist.txt以便將來使用以便將來使用hmmlist1.txtCOMMENTThis PCF produces a single mixture,single stream prototypesystemhsKind:PcovKind:DnStates:6nStreams:1sWidths:39m
6、ixes:1parmKind:MFCC_D_A_EvecSize:39outDir:model_structhmmList:hmmlist1.txtmodel_struct1.pcfhmmlist2.txtsillingiersansuwuliouchibajiouhmmlist3.txtspStep 4:計算training data的mean及variance 作為模型初值v建立訓練音路徑列表檔filelist_odd.txtv造一個模型根目錄models,及其下子目錄hmm0hmm20以存放各階段的模型檔mkdir modelsdel/s/q models*for/L%m in(0,1,
7、20)do mkdir modelshmm%mv先將將各個HMM檔合併成總模型檔且同時將所有模型狀態綁在一起(連動),然後以所有訓練語料變異數及平均值作其初值,啟用HCompV計算變異數下限設定值,最後將vFloors定義也加進總模型檔且同時把狀態綁在一起的狀態解開。建立tie_all_state.hed,內容為 TI allstate*.state1-100建立untie_all_state.hed,內容為 UT*.state1-100HHed-d model_struct-M models/hmm0-w hmmdefs tie_all_state.hed hmmlist.txtHERest
8、-S filelist_odd.txt-H models/hmm0/hmmdefs-M models/hmm0-I syllable_trans_sp.mlf hmmlist.txtHCompV -f 0.01-m-S filelist_odd.txt-M models/hmm0 model_struct/sp HHed-H models/hmm0/hmmdefs-H models/hmm0/vFloors-M models/hmm0-w hmmdefs untie_all_state.hed hmmlist.txtStep 5:靜音回繞及與短間隔音的連結v建立shi.hedHHed-H mo
9、dels/hmm0/hmmdefs-M models/hmm0-w hmmdefs shi.hed hmmlist.txtAT 2 4 0.2 sil.transPAT 4 2 0.2 sil.transPAT 1 3 0.3 sp.transPTI silst sil.state3,sp.state2AT為增加轉移機率silence第2狀態轉移第4狀態的機率為0.2創造一個TEE模型叫silst,將sil的第3狀態與sp的第2狀態連結在一起Step 6:HMM訓練vHERest-S filelist_odd.txt-H models/hmm0/hmmdefs-M models/hmm1-I
10、syllable_trans_sp.mlf hmmlist.txtvHERest-S filelist_odd.txt-H models/hmm1/hmmdefs-M models/hmm2-I syllable_trans_sp.mlf hmmlist.txtvHERest-S filelist_odd.txt-H models/hmm2/hmmdefs-M models/hmm3-I syllable_trans_sp.mlf hmmlist.txtvHERest-S filelist_odd.txt-H models/hmm3/hmmdefs-M models/hmm4-I syllab
11、le_trans_sp.mlf hmmlist.txtvHERest-S filelist_odd.txt-H models/hmm4/hmmdefs-M models/hmm5-I syllable_trans_sp.mlf hmmlist.txtStep 7:建立文法規則及產生連字網路規則v建立文法規則gram.txt v執行HParse gram.txt net.txt gram.txt$digit=d0|d1|d2|d3|d4|d5|d6|d7|d8|d9;(SILENCE SILENCE)Step 8:增加混合數v建立模型編修指令檔 increase_mix_2.hedv執行模型編修
12、程式HHEd-H models/hmm5/hmmdefs-M models/hmm6 increase_mix_2.hed hmmlist.txtv再訓練2次HERest-S filelist_odd.txt-H models/hmm6/hmmdefs-M models/hmm7-I syllable_trans_sp.mlf hmmlist.txtHERest-S filelist_odd.txt-H models/hmm7/hmmdefs-M models/hmm8-I syllable_trans_sp.mlf hmmlist.txtMU 2*.state1-100.mixStep 9:
13、語音辨認v造一個存放辨認輸出的目錄tempmkdir tempdel/q/s temp*v進行辨認HVite -H models/hmm8/hmmdefs-S filelist_even.txt -i temprec_out.mlf-w net.txt word_to_syllable_sp.dic hmmlist.txtv將所有用到的字,全部列在wordlist.txt檔案中v分析辨認結果HResults-p-I word_trans.mlf wordlist.txt temprec_out.mlf temp.txt或HResults-p-I word_trans.mlf word_to_syllable_sp.dic temprec_out.mlf temp.txt觀看 temp.txt 檔案Step 10:繼續增加混合數 依step 8 所描述的方式繼續增加混合數,然後再做訓練與辨認,直到適當性能。
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。