Please use this identifier to cite or link to this item:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/40927| Title: | 自發性國語語音中自動偵測填充式停頓之初步研究 A Preliminary Study on Automatic Detection of Filled Pause in Spontaneous Mandarin Speech |
| Authors: | Yi Lee 李易 |
| Advisor: | 李琳山 |
| Keyword: | 自發性語音,不流暢語音,填充式停頓,多層感知器, spontaneous speech,disfluent speech,filled pause,multilayer perceptron, |
| Publication Year : | 2008 |
| Degree: | 碩士 |
| Abstract: | 在今天,朗讀式語音的辨識已經有相當不錯的成果,但對於辨識自發性語音則仍然面對許多難題,其中重要的一個就是自發性語音中存在著的許多不流暢現象,例如:填充式停頓、重述、重新起始、延長、改正等等,而從這些不流暢會衍生出許多問題,造成自動語音辨識系統效能的降低,而其中最常出現的不流暢現象就是填充式停頓,例如國語中的「嗯」、「啊」、「呃」等等。
而填充式停頓與流暢語音的不同之處在於填充式停頓在聲學上常為中央發音的母音,在韻律上延長,聲波、時頻譜有變動緩慢平滑的特性,在語言方面則有較高的機率被靜默停頓所緊鄰。 本論文便針對上述的這些特性來設計獨立於語音辨識器之外的填充式停頓的偵測技術。首先根據梅爾倒頻譜係數向量變化的劇烈程度來抽取潛在的語段邊界,再依照填充式停頓的特性來抽取各語段的特徵值形成特徵向量,最後以多層感知器為主要分類器配合三種不同策略來對每個語段做分類。 我們能夠在CALLHOME語料中面對平衡分佈資料時同時得到約70%以上的召回率以及精確率,但面對真實分佈的資料則只能同時達到約20%,能否將這樣效能的填充式停頓偵測整合在語音辨識器中以改進字詞辨識準確率則尚待檢驗。 |
| URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/40927 |
| Fulltext Rights: | 有償授權 |
| Appears in Collections: | 電信工程學研究所 |
Files in This Item:
| File | Size | Format | |
|---|---|---|---|
| ntu-97-1.pdf Restricted Access | 7.24 MB | Adobe PDF |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
