串接群聚階層式多層感知器聲學模型之中文大字彙語
音辨識

Shuo-Yiin Chang; 張碩尹

請用此 Handle URI 來引用此文件： http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/43000

標題:	串接群聚階層式多層感知器聲學模型之中文大字彙語音辨識 Large Vocabulary Mandarin Speech Recognition Based on Tandem System with Clustered Hierarchical Multi-layer Perceptron
作者:	Shuo-Yiin Chang 張碩尹
指導教授:	李琳山(Lin-Shan Lee)
關鍵字:	大字彙語音辨識,聲學模型,多層感知器, LVCSR,Acoustic Model,Multi-layer Perceptron,
出版年 :	2009
學位:	碩士
摘要:	在傳統的聲學模型中，連續機率密度隱藏馬可夫模型最為被廣泛使用。但是連續機率密度隱藏馬可夫模型有一些無法克服的缺點，近年不少研究藉由不同的訓練方法或是結合不同機器學習的技術以改進連續機率密度隱藏馬可夫模型，這些方法在新一代的語音辨識技術上已漸受肯定並普受重視，而且有不少被實踐在各項國際競賽中。本論文即是嘗試使用多層感知器來幫助聲學模型辨識的研究。在本論文中，我們提出藉由音素分群建立的階層式多層感知器。一般串接模型中以單一多層感知器學習概括性的音素分類，很難區分混淆的音素；本論文藉由拆解概括性音素分類問題為一組針對性的階層式分類，將複雜的音素分類問題分而治之，並且討論在不同的分群結構下階層式多層感知器的表現，之後再以由下而上的訓練方法，進一步改進階層式多層感知器。最後在以上述的方法為第一階段辨識，由隱藏馬可夫與多層感知器混合模型以及隱藏馬可夫(KL)模型重新計分。這些方法在中文大字彙新聞辨識中都證實可以使辨識正確率有明確進步。
URI:	http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/43000
全文授權:	有償授權
顯示於系所單位：	電信工程學研究所

文件中的檔案：

檔案	大小	格式
ntu-98-1.pdf 未授權公開取用	2.89 MB	Adobe PDF

顯示文件完整紀錄

系統中的文件，除了特別指名其著作權條款之外，均受到著作權保護，並且保留所有的權利。

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料（如：文字、圖片、PDF）並使其易於取用。