整合以特徵及模型之技術以語音查詢口語詞彙

Chun-Hsun Chen; 陳俊勳

請用此 Handle URI 來引用此文件： http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/31395

標題:	整合以特徵及模型之技術以語音查詢口語詞彙 Integration of Feature-based and Model-based Approaches for Spoken Term Detection with Spoken Query
作者:	Chun-Hsun Chen 陳俊勳
指導教授:	李琳山(Lin-Shan Lee)
關鍵字:	語音搜尋,語音查詢,口語詞彙, STD,SDR,QBE,spoken query,
出版年 :	2011
學位:	碩士
摘要:	在現代手持式裝置日漸普遍的情況下，語音檢索的應用已經相當廣泛，像是手機聯絡人查詢、商家查詢等等，也因此語音檢索的研究就成為了一個非常重要的課題。而本論文針對以口語詞彙作語音查詢的部分去做研究，藉由不同的檢索方法，我們希望能夠讓系統更完善。在以模型為基礎的技術方面，我們使用「位置特定事後機率詞圖」做研究，將語音查詢問句及語音文件都辨識為位置特定事後機率詞圖，並針對不同的語音搜尋比對方式、距離度量方式、分數權重、多查詢詞模組做實驗。再來，我們在以特徵為基礎的技術方面做研究，不用模型少了辨識系統，我們只針對語音查詢問句及語音文件的特徵做比對。最後我們結合兩者，以二階段架構進行整合。最後的結果，以二階段串聯架構表現最佳。其對於單一模組的語音查詢問句，檢索最佳平均準確率是詞典內語音查詢問句為 60.81% ，詞典外語音查詢問句為 41.68% 。對於結合五模組的語音查詢問句，檢索最佳平均準確率是詞典內語音查詢問句為 81.24% ，詞典外語音查詢問句為 61.85% 。
URI:	http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/31395
全文授權:	有償授權
顯示於系所單位：	資訊工程學系

文件中的檔案：

檔案	大小	格式
ntu-100-1.pdf 未授權公開取用	2.73 MB	Adobe PDF

顯示文件完整紀錄

系統中的文件，除了特別指名其著作權條款之外，均受到著作權保護，並且保留所有的權利。

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料（如：文字、圖片、PDF）並使其易於取用。