使用結構化支撐向量機之音素辨識

Chao-Hong Meng; 孟昭宏

請用此 Handle URI 來引用此文件： http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/46439

標題:	使用結構化支撐向量機之音素辨識 Phone Recognition using Structural Support Vector Machine
作者:	Chao-Hong Meng 孟昭宏
指導教授:	李琳山(Lin-Shan Lee)
關鍵字:	支撐向量機,音素辨識, Phone Recognition,SVM,
出版年 :	2010
學位:	碩士
摘要:	語音辨識(Speech Recognition)問題可視為針對一段語音訊號求出所對應的詞串。這個問題由於結構十分複雜，所以在傳統上，我們都是將問題用貝氏定理(Bayes Theorem)拆解成聲學模型(Acoustic Model)與語言模型(Language Model)兩個子問題，這兩個子問題結構比較單純，方便我們用隱藏式馬可夫模型(Hidden Markov Model)來解決。但隱藏式馬可夫模型估測參數的時候傳統上使用最大相似度估測法(Maximum Likelihood Estimation)，容易在不同模型之間造成混淆。乃有人提出鑑別式訓練法(Discriminative Training)，讓傳統的模型架構也具備鑑別力。隨著機器學習領域的發展，我們逐漸有能力直接解決語音辨識的問題而未必需要將它拆成兩個子問題，而這樣的模型多半天生就具備鑑別能力。本論文便嘗試在這樣的架構下先進行初步的音素辨識。論文中使用的模型為結構化支持向量機(Structural Support Vector Machine)。實驗顯示，所獲得之音素正確率(Phone Accuracy)會超過串接式系統(Tandem System)的1%
URI:	http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/46439
全文授權:	有償授權
顯示於系所單位：	資訊工程學系

文件中的檔案：

檔案	大小	格式
ntu-99-1.pdf 目前未授權公開取用	2.27 MB	Adobe PDF

顯示文件完整紀錄

系統中的文件，除了特別指名其著作權條款之外，均受到著作權保護，並且保留所有的權利。

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料（如：文字、圖片、PDF）並使其易於取用。