Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 電信工程學研究所
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/43000
標題: 串接群聚階層式多層感知器聲學模型之中文大字彙語
音辨識
Large Vocabulary Mandarin Speech Recognition
Based on Tandem System with Clustered
Hierarchical Multi-layer Perceptron
作者: Shuo-Yiin Chang
張碩尹
指導教授: 李琳山(Lin-Shan Lee)
關鍵字: 大字彙語音辨識,聲學模型,多層感知器,
LVCSR,Acoustic Model,Multi-layer Perceptron,
出版年 : 2009
學位: 碩士
摘要: 在傳統的聲學模型中,連續機率密度隱藏馬可夫模型最為被廣泛使用。但是
連續機率密度隱藏馬可夫模型有一些無法克服的缺點,近年不少研究藉由不同的
訓練方法或是結合不同機器學習的技術以改進連續機率密度隱藏馬可夫模型,這
些方法在新一代的語音辨識技術上已漸受肯定並普受重視,而且有不少被實踐在
各項國際競賽中。本論文即是嘗試使用多層感知器來幫助聲學模型辨識的研究。
在本論文中,我們提出藉由音素分群建立的階層式多層感知器。一般串接模
型中以單一多層感知器學習概括性的音素分類,很難區分混淆的音素;本論文藉
由拆解概括性音素分類問題為一組針對性的階層式分類,將複雜的音素分類問題
分而治之,並且討論在不同的分群結構下階層式多層感知器的表現,之後再以由
下而上的訓練方法,進一步改進階層式多層感知器。
最後在以上述的方法為第一階段辨識,由隱藏馬可夫與多層感知器混合模型
以及隱藏馬可夫(KL)模型重新計分。這些方法在中文大字彙新聞辨識中都證實可
以使辨識正確率有明確進步。
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/43000
全文授權: 有償授權
顯示於系所單位:電信工程學研究所

文件中的檔案:
檔案 大小格式 
ntu-98-1.pdf
  目前未授權公開取用
2.89 MBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved