請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/31395
標題: | 整合以特徵及模型之技術以語音查詢口語詞彙 Integration of Feature-based and Model-based Approaches for Spoken Term Detection with Spoken Query |
作者: | Chun-Hsun Chen 陳俊勳 |
指導教授: | 李琳山(Lin-Shan Lee) |
關鍵字: | 語音搜尋,語音查詢,口語詞彙, STD,SDR,QBE,spoken query, |
出版年 : | 2011 |
學位: | 碩士 |
摘要: | 在現代手持式裝置日漸普遍的情況下,語音檢索的應用已經相當廣泛,像是手機聯絡人查詢、商家查詢等等,也因此語音檢索的研究就成為了一個非常重要的課題。而本論文針對以口語詞彙作語音查詢的部分去做研究,藉由不同的檢索方法,我們希望能夠讓系統更完善。
在以模型為基礎的技術方面,我們使用「位置特定事後機率詞圖」做研究,將語音查詢問句及語音文件都辨識為位置特定事後機率詞圖,並針對不同的語音搜尋比對方式、距離度量方式、分數權重、多查詢詞模組做實驗。再來,我們在以特徵為基礎的技術方面做研究,不用模型少了辨識系統,我們只針對語音查詢問句及語音文件的特徵做比對。最後我們結合兩者,以二階段架構進行整合。 最後的結果,以二階段串聯架構表現最佳。其對於單一模組的語音查詢問句,檢索最佳平均準確率是詞典內語音查詢問句為 60.81% ,詞典外語音查詢問句為 41.68% 。對於結合五模組的語音查詢問句,檢索最佳平均準確率是詞典內語音查詢問句為 81.24% ,詞典外語音查詢問句為 61.85% 。 |
URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/31395 |
全文授權: | 有償授權 |
顯示於系所單位: | 資訊工程學系 |
文件中的檔案:
檔案 | 大小 | 格式 | |
---|---|---|---|
ntu-100-1.pdf 目前未授權公開取用 | 2.73 MB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。