Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資訊工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/18387
標題: 中英混合語音辨識的研究與實作
Research and Implementation of Chinese-English Mixed Speech Recognition
作者: Chen-Hung Yang
楊晨弘
指導教授: 張智星(Jyh-Shing Jang)
關鍵字: 多語言混合辨識,時延神經網路,大詞彙語音辨識,
code-switching recognition,time-delay neural networks,LVCSR,
出版年 : 2020
學位: 碩士
摘要: 本論文主要的研究目的為透過訓練中英混合的語音辨識,解決日常生活中常見的中英夾雜對話之辨識問題,研究中的應用情境為日常的中英夾雜對話。本篇論文利用了傳統的GMM-HMM方法以及深層神經網路混合模型DNN-HMM的方法,用以訓練聲學模型。透過處理各種不同的文本(例如:PTT、MATBN以及WSJ),以SRILM的方法訓練語言模型。實驗中的測試語料則是採用 EAT 所切分的測試資料以及國立臺灣大學米爾實驗室(MIRLAB)所錄製的中英混合句子作為測試。本篇論文在嘗試 TCC300 與 WSJ 之搭配以及 MATBN 與 WSJ 之搭配,爾後採取不同標音方式探討其結果,再者則是加入 台灣英語語料庫 (English across Taiwan, EAT)及部分的文字後處理,最後得到30.27%的詞錯誤率,相較於未加入 EAT 的詞錯誤率改良了 32.16 %。
The main purpose of this thesis is to solve the common Chinese-English mixed recognition problem in daily conversation by constructing a recogni- tion engine that can deal with such mixed code conversation. We use both the traditional GMM-HMM model and the deep neural network hybrid model(DNN- HMM) as acoustic models for both Chinese and English. We also use various source of texts, including PTT, MATBN, and WSJ to train the language model via the SRILM method. The test copora in the experiments include MIR Chi- nese/English mixed test dataset and and EAT test data. First, we tried the mix of TCC300 and WSJ, and the mix of MATBN and WSJ, for construct- ing acoustic models and compared their performance. Second, we used two different phonetic alphabets to compare their recognition results. Finally, we found the best performance can be achieved by using the mix of MATBN, WSJ, and English across Taiwan corpus (EAT), with a post-processing, to achieve 30.27% word error rate, which is about 32.16% of error reduction when compared with the result without EAT.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/18387
DOI: 10.6342/NTU202003127
全文授權: 未授權
顯示於系所單位:資訊工程學系

文件中的檔案:
檔案 大小格式 
U0001-1208202016524300.pdf
  目前未授權公開取用
2.97 MBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved