請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/40927| 標題: | 自發性國語語音中自動偵測填充式停頓之初步研究 A Preliminary Study on Automatic Detection of Filled Pause in Spontaneous Mandarin Speech |
| 作者: | Yi Lee 李易 |
| 指導教授: | 李琳山 |
| 關鍵字: | 自發性語音,不流暢語音,填充式停頓,多層感知器, spontaneous speech,disfluent speech,filled pause,multilayer perceptron, |
| 出版年 : | 2008 |
| 學位: | 碩士 |
| 摘要: | 在今天,朗讀式語音的辨識已經有相當不錯的成果,但對於辨識自發性語音則仍然面對許多難題,其中重要的一個就是自發性語音中存在著的許多不流暢現象,例如:填充式停頓、重述、重新起始、延長、改正等等,而從這些不流暢會衍生出許多問題,造成自動語音辨識系統效能的降低,而其中最常出現的不流暢現象就是填充式停頓,例如國語中的「嗯」、「啊」、「呃」等等。
而填充式停頓與流暢語音的不同之處在於填充式停頓在聲學上常為中央發音的母音,在韻律上延長,聲波、時頻譜有變動緩慢平滑的特性,在語言方面則有較高的機率被靜默停頓所緊鄰。 本論文便針對上述的這些特性來設計獨立於語音辨識器之外的填充式停頓的偵測技術。首先根據梅爾倒頻譜係數向量變化的劇烈程度來抽取潛在的語段邊界,再依照填充式停頓的特性來抽取各語段的特徵值形成特徵向量,最後以多層感知器為主要分類器配合三種不同策略來對每個語段做分類。 我們能夠在CALLHOME語料中面對平衡分佈資料時同時得到約70%以上的召回率以及精確率,但面對真實分佈的資料則只能同時達到約20%,能否將這樣效能的填充式停頓偵測整合在語音辨識器中以改進字詞辨識準確率則尚待檢驗。 |
| URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/40927 |
| 全文授權: | 有償授權 |
| 顯示於系所單位: | 電信工程學研究所 |
文件中的檔案:
| 檔案 | 大小 | 格式 | |
|---|---|---|---|
| ntu-97-1.pdf 未授權公開取用 | 7.24 MB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。
