Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 電信工程學研究所
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/40927
標題: 自發性國語語音中自動偵測填充式停頓之初步研究
A Preliminary Study on Automatic Detection of
Filled Pause in Spontaneous Mandarin Speech
作者: Yi Lee
李易
指導教授: 李琳山
關鍵字: 自發性語音,不流暢語音,填充式停頓,多層感知器,
spontaneous speech,disfluent speech,filled pause,multilayer perceptron,
出版年 : 2008
學位: 碩士
摘要: 在今天,朗讀式語音的辨識已經有相當不錯的成果,但對於辨識自發性語音則仍然面對許多難題,其中重要的一個就是自發性語音中存在著的許多不流暢現象,例如:填充式停頓、重述、重新起始、延長、改正等等,而從這些不流暢會衍生出許多問題,造成自動語音辨識系統效能的降低,而其中最常出現的不流暢現象就是填充式停頓,例如國語中的「嗯」、「啊」、「呃」等等。
而填充式停頓與流暢語音的不同之處在於填充式停頓在聲學上常為中央發音的母音,在韻律上延長,聲波、時頻譜有變動緩慢平滑的特性,在語言方面則有較高的機率被靜默停頓所緊鄰。
本論文便針對上述的這些特性來設計獨立於語音辨識器之外的填充式停頓的偵測技術。首先根據梅爾倒頻譜係數向量變化的劇烈程度來抽取潛在的語段邊界,再依照填充式停頓的特性來抽取各語段的特徵值形成特徵向量,最後以多層感知器為主要分類器配合三種不同策略來對每個語段做分類。
我們能夠在CALLHOME語料中面對平衡分佈資料時同時得到約70%以上的召回率以及精確率,但面對真實分佈的資料則只能同時達到約20%,能否將這樣效能的填充式停頓偵測整合在語音辨識器中以改進字詞辨識準確率則尚待檢驗。
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/40927
全文授權: 有償授權
顯示於系所單位:電信工程學研究所

文件中的檔案:
檔案 大小格式 
ntu-97-1.pdf
  未授權公開取用
7.24 MBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved