Skip navigation

DSpace JSPUI

DSpace preserves and enables easy and open access to all types of digital content including text, images, moving images, mpegs and data sets

Learn More
DSpace logo
English
中文
  • Browse
    • Communities
      & Collections
    • Publication Year
    • Author
    • Title
    • Subject
    • Advisor
  • Search TDR
  • Rights Q&A
    • My Page
    • Receive email
      updates
    • Edit Profile
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 電信工程學研究所
Please use this identifier to cite or link to this item: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/43000
Title: 串接群聚階層式多層感知器聲學模型之中文大字彙語
音辨識
Large Vocabulary Mandarin Speech Recognition
Based on Tandem System with Clustered
Hierarchical Multi-layer Perceptron
Authors: Shuo-Yiin Chang
張碩尹
Advisor: 李琳山(Lin-Shan Lee)
Keyword: 大字彙語音辨識,聲學模型,多層感知器,
LVCSR,Acoustic Model,Multi-layer Perceptron,
Publication Year : 2009
Degree: 碩士
Abstract: 在傳統的聲學模型中,連續機率密度隱藏馬可夫模型最為被廣泛使用。但是
連續機率密度隱藏馬可夫模型有一些無法克服的缺點,近年不少研究藉由不同的
訓練方法或是結合不同機器學習的技術以改進連續機率密度隱藏馬可夫模型,這
些方法在新一代的語音辨識技術上已漸受肯定並普受重視,而且有不少被實踐在
各項國際競賽中。本論文即是嘗試使用多層感知器來幫助聲學模型辨識的研究。
在本論文中,我們提出藉由音素分群建立的階層式多層感知器。一般串接模
型中以單一多層感知器學習概括性的音素分類,很難區分混淆的音素;本論文藉
由拆解概括性音素分類問題為一組針對性的階層式分類,將複雜的音素分類問題
分而治之,並且討論在不同的分群結構下階層式多層感知器的表現,之後再以由
下而上的訓練方法,進一步改進階層式多層感知器。
最後在以上述的方法為第一階段辨識,由隱藏馬可夫與多層感知器混合模型
以及隱藏馬可夫(KL)模型重新計分。這些方法在中文大字彙新聞辨識中都證實可
以使辨識正確率有明確進步。
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/43000
Fulltext Rights: 有償授權
Appears in Collections:電信工程學研究所

Files in This Item:
File SizeFormat 
ntu-98-1.pdf
  Restricted Access
2.89 MBAdobe PDF
Show full item record


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved