Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 電信工程學研究所
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/31717
標題: 使用韻律模型的進一步大字彙國語連續語音辨識
Improved Large Vocabulary Continuous Mandarin Speech Recognition By Prosodic Modeling
作者: Jui-Ting Huang
黃瑞婷
指導教授: 李琳山
關鍵字: 韻律,語音辨識,
prosody,speech recognition,
出版年 : 2006
學位: 碩士
摘要: 人類利用了大量的韻律(Prosody)訊息在日常的口語溝通裡,因此在語音技術中加入韻律相關訊息是讓系統更智慧化與擬人化的途徑之一。本論文企圖突破現今的語音辨識技術,利用韻律訊息來協助辨識。除了傳統頻譜特徵例如MFCC之外,從語音中抽取了韻律特徵來幫助辨識,並訓練韻律模型來建立模型以描述韻律特徵與文字結構的關係。
本論文主要以音節為單位計算了許多基頻、能量、長度相關的參數,有些參數是基於韻律學相關知識,推測可能與聲調及韻律詞邊界有關;其他則是列出各種可能的組合,期望用下一步的韻律模型自動選擇出重要的參數。並針對韻律特徵與中文之間的關係提出了韻律詞模型和階層模型兩種方法。並探討基於高斯混合模型(Gaussian Mixture Models)和分類法的模型實現,也提出了企圖結合兩者優點的結合法。其中基於分類法的階層模型有最好的分類正確率。
本論文採取兩段式(two pass)大字彙中文辨識架構。第一階段利用基礎辨識器產生詞圖(word graph)之後,第二階段把韻律模型計算的分數加入每個詞弧(word arc),對詞圖的每一條可能路徑重新評分,然後決定最可能的辨識結果。實驗顯示,韻律模型的整合可增加基礎實驗的字正確率約0.35~1.45%的辨識率。
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/31717
全文授權: 有償授權
顯示於系所單位:電信工程學研究所

文件中的檔案:
檔案 大小格式 
ntu-95-1.pdf
  目前未授權公開取用
544.22 kBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved