Skip navigation

DSpace JSPUI

DSpace preserves and enables easy and open access to all types of digital content including text, images, moving images, mpegs and data sets

Learn More
DSpace logo
English
中文
  • Browse
    • Communities
      & Collections
    • Publication Year
    • Author
    • Title
    • Subject
    • Advisor
  • Search TDR
  • Rights Q&A
    • My Page
    • Receive email
      updates
    • Edit Profile
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 電信工程學研究所
Please use this identifier to cite or link to this item: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/40927
Title: 自發性國語語音中自動偵測填充式停頓之初步研究
A Preliminary Study on Automatic Detection of
Filled Pause in Spontaneous Mandarin Speech
Authors: Yi Lee
李易
Advisor: 李琳山
Keyword: 自發性語音,不流暢語音,填充式停頓,多層感知器,
spontaneous speech,disfluent speech,filled pause,multilayer perceptron,
Publication Year : 2008
Degree: 碩士
Abstract: 在今天,朗讀式語音的辨識已經有相當不錯的成果,但對於辨識自發性語音則仍然面對許多難題,其中重要的一個就是自發性語音中存在著的許多不流暢現象,例如:填充式停頓、重述、重新起始、延長、改正等等,而從這些不流暢會衍生出許多問題,造成自動語音辨識系統效能的降低,而其中最常出現的不流暢現象就是填充式停頓,例如國語中的「嗯」、「啊」、「呃」等等。
而填充式停頓與流暢語音的不同之處在於填充式停頓在聲學上常為中央發音的母音,在韻律上延長,聲波、時頻譜有變動緩慢平滑的特性,在語言方面則有較高的機率被靜默停頓所緊鄰。
本論文便針對上述的這些特性來設計獨立於語音辨識器之外的填充式停頓的偵測技術。首先根據梅爾倒頻譜係數向量變化的劇烈程度來抽取潛在的語段邊界,再依照填充式停頓的特性來抽取各語段的特徵值形成特徵向量,最後以多層感知器為主要分類器配合三種不同策略來對每個語段做分類。
我們能夠在CALLHOME語料中面對平衡分佈資料時同時得到約70%以上的召回率以及精確率,但面對真實分佈的資料則只能同時達到約20%,能否將這樣效能的填充式停頓偵測整合在語音辨識器中以改進字詞辨識準確率則尚待檢驗。
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/40927
Fulltext Rights: 有償授權
Appears in Collections:電信工程學研究所

Files in This Item:
File SizeFormat 
ntu-97-1.pdf
  Restricted Access
7.24 MBAdobe PDF
Show full item record


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved