Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 電機工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/16104
標題: 基於子空間之口說語言辨識
Subspace-based Spoken Language Recognition
作者: Yu-Chin Shih
施羽芩
指導教授: 鄭士康(Shyh-Kang Jeng)
共同指導教授: 王新民(Hsin-Min Wang)
關鍵字: 語言辨識,基於子空間學習法,
language recognition,subspace-based learning,
出版年 : 2012
學位: 碩士
摘要: 本論文提出了一個嶄新且基於子空間的方法來實現基於音素結構的自動語言辨識。整個方法分為兩大部分,語音訊號的特徵表示法和基於子空間的學習演算法。前者利用了語音訊號中前後音素的關係與限制,透過自動語音辨識器的解碼、音素序列中各個音素的概似度計算,以及特徵串接,擷取出富含音素資訊的音素框。假設擷取出的音素框分布於一個低維度的特徵子空間,在這個空間中每段語音的結構幾乎可以完全被保留,因此每段語音又可進一步表示成固定維度的子空間。後者以非歐式距離的度量方法測量兩段語音(子空間)之間的相似性或距離,再利用基於距離或基於核的鑑別式分析進行特徵處理,最後使用後端的分類器,像是k鄰近分類法,來進行分類。實驗於OGI-TS和NIST LRE 2005這兩套資料庫上,結果顯示我們提出的方法在相等錯誤率上均勝過以向量空間模型為基礎的方法。
This thesis presents a novel subspace-based approach for phonotactic language recognition. The whole framework is divided into two parts: speech feature representations and the subspace-based learning algorithms. First, the phonetic information as well as the contextual relationship, possessed by spoken utterances, are more abundantly retrieved by likelihood computation and feature concatenation through the decoding processed by an automatic speech recognizer. It is assumed that the extracted phone frames reside in a lower dimensional eigen-subspace, in which the structure of data can be approximately captured. Each utterance is further represented by a fixed-dimensional linear subspace. Second, to measure the similarity between two utterances, suitable non-Euclidean metrics are explored and applied to linear discriminant analysis in two kinds of mechanisms: the distance-based and kernel-based learning algorithms, followed by a back-end classifier, such as the k-nearest neighbor (KNN) classifier. The results of experiments on the OGI-TS and the NIST LRE 2005 databases demonstrate that the proposed framework outperforms the well-known vector space modeling based method in equal error rate (EER).
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/16104
全文授權: 未授權
顯示於系所單位:電機工程學系

文件中的檔案:
檔案 大小格式 
ntu-101-1.pdf
  未授權公開取用
2.52 MBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved