對於語碼轉換和語音翻譯任務之資料稀缺性與非自回歸模型研究

Shun-Po Chuang; 莊舜博; f04942141

請用此 Handle URI 來引用此文件： http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/79234

標題:	對於語碼轉換和語音翻譯任務之資料稀缺性與非自回歸模型研究 Investigate the data scarcity issue and non-autoregressive model in Code-switching and Speech-to-text translation
作者:	Shun-Po Chuang 莊舜博 f04942141
指導教授:	李宏毅(Hung-yi Lee)
關鍵字:	語音翻譯,語碼轉換,資料稀缺性,非自回歸模型, Speech Translation,Code-Switching,Data scarcity,non-autoregressive model,
出版年 :	2022
學位:	博士
摘要:	近年因深度學習技術的興起，有越來越多任務採用完全端到端的模型，其表現能夠超越傳統的串接式模型，同時帶來開發上的便利。然而，端到端模型需要相當龐大的標注數據進行模型訓練，但標注資料的過程相當耗時且成本較高，在某些任務上仍然有資料短缺的情況。本篇論文以語碼轉換和語音翻譯做為研究任務，探討資料稀缺性問題。在語碼轉換任務上，由於資料普遍存在於日常生活對話或私人訊息中，其資料搜集的難度較高，所以目前公開可使用的資料集相當少。此論文首先研究在完全沒有語碼轉換資料的狀況下，如何訓練一個語碼轉換的語言模型；在語音翻譯的任務上，訓練模型需要配對的語音和譯文，此種配對資料較為罕見，相較於語音辨識所需的配對語音和文本、機器翻譯所需的雙語配對文本，現今語音翻譯任務仍有資料稀缺性的問題，故本論文討論在資料有限的狀況下，如何有效利用額外的未配對資料進行模型表現的改進。此外，現今語音的端到端模型皆採用自回歸模式進行解碼，自回歸的解碼方式帶來良好的語言建模能力，但解碼過程卻相當耗時，在資源有限的條件下不利於現實生活中的應用；針對此問題，本論文同時也探討了語碼轉換和語音翻譯的非自回歸模型，以期以更快的速度得到良好的模型表現。
URI:	http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/79234
DOI:	10.6342/NTU202200129
全文授權:	同意授權(全球公開)
顯示於系所單位：	電信工程學研究所

文件中的檔案：

檔案	大小	格式
U0001-2101202201531800.pdf	3.96 MB	Adobe PDF	檢視/開啟

顯示文件完整紀錄

系統中的文件，除了特別指名其著作權條款之外，均受到著作權保護，並且保留所有的權利。

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料（如：文字、圖片、PDF）並使其易於取用。