Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 電信工程學研究所
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/79234
標題: 對於語碼轉換和語音翻譯任務之資料稀缺性與非自回歸模型研究
Investigate the data scarcity issue and non-autoregressive model in Code-switching and Speech-to-text translation
作者: Shun-Po Chuang
莊舜博
f04942141
指導教授: 李宏毅(Hung-yi Lee)
關鍵字: 語音翻譯,語碼轉換,資料稀缺性,非自回歸模型,
Speech Translation,Code-Switching,Data scarcity,non-autoregressive model,
出版年 : 2022
學位: 博士
摘要: 近年因深度學習技術的興起,有越來越多任務採用完全端到端的模型,其表現能夠超越傳統的串接式模型,同時帶來開發上的便利。然而,端到端模型需要相當龐大的標注數據進行模型訓練,但標注資料的過程相當耗時且成本較高,在某些任務上仍然有資料短缺的情況。 本篇論文以語碼轉換和語音翻譯做為研究任務,探討資料稀缺性問題。在語碼轉換任務上,由於資料普遍存在於日常生活對話或私人訊息中,其資料搜集的難度較高,所以目前公開可使用的資料集相當少。此論文首先研究在完全沒有語碼轉換資料的狀況下,如何訓練一個語碼轉換的語言模型;在語音翻譯的任務上,訓練模型需要配對的語音和譯文,此種配對資料較為罕見,相較於語音辨識所需的配對語音和文本、機器翻譯所需的雙語配對文本,現今語音翻譯任務仍有資料稀缺性的問題,故本論文討論在資料有限的狀況下,如何有效利用額外的未配對資料進行模型表現的改進。 此外,現今語音的端到端模型皆採用自回歸模式進行解碼,自回歸的解碼方式帶來良好的語言建模能力,但解碼過程卻相當耗時,在資源有限的條件下不利於現實生活中的應用;針對此問題,本論文同時也探討了語碼轉換和語音翻譯的非自回歸模型,以期以更快的速度得到良好的模型表現。
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/79234
DOI: 10.6342/NTU202200129
全文授權: 同意授權(全球公開)
顯示於系所單位:電信工程學研究所

文件中的檔案:
檔案 大小格式 
U0001-2101202201531800.pdf3.96 MBAdobe PDF檢視/開啟
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved