Skip navigation

DSpace JSPUI

DSpace preserves and enables easy and open access to all types of digital content including text, images, moving images, mpegs and data sets

Learn More
DSpace logo
English
中文
  • Browse
    • Communities
      & Collections
    • Publication Year
    • Author
    • Title
    • Subject
    • Advisor
  • Search TDR
  • Rights Q&A
    • My Page
    • Receive email
      updates
    • Edit Profile
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 電信工程學研究所
Please use this identifier to cite or link to this item: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/79234
Title: 對於語碼轉換和語音翻譯任務之資料稀缺性與非自回歸模型研究
Investigate the data scarcity issue and non-autoregressive model in Code-switching and Speech-to-text translation
Authors: Shun-Po Chuang
莊舜博
f04942141
Advisor: 李宏毅(Hung-yi Lee)
Keyword: 語音翻譯,語碼轉換,資料稀缺性,非自回歸模型,
Speech Translation,Code-Switching,Data scarcity,non-autoregressive model,
Publication Year : 2022
Degree: 博士
Abstract: 近年因深度學習技術的興起,有越來越多任務採用完全端到端的模型,其表現能夠超越傳統的串接式模型,同時帶來開發上的便利。然而,端到端模型需要相當龐大的標注數據進行模型訓練,但標注資料的過程相當耗時且成本較高,在某些任務上仍然有資料短缺的情況。 本篇論文以語碼轉換和語音翻譯做為研究任務,探討資料稀缺性問題。在語碼轉換任務上,由於資料普遍存在於日常生活對話或私人訊息中,其資料搜集的難度較高,所以目前公開可使用的資料集相當少。此論文首先研究在完全沒有語碼轉換資料的狀況下,如何訓練一個語碼轉換的語言模型;在語音翻譯的任務上,訓練模型需要配對的語音和譯文,此種配對資料較為罕見,相較於語音辨識所需的配對語音和文本、機器翻譯所需的雙語配對文本,現今語音翻譯任務仍有資料稀缺性的問題,故本論文討論在資料有限的狀況下,如何有效利用額外的未配對資料進行模型表現的改進。 此外,現今語音的端到端模型皆採用自回歸模式進行解碼,自回歸的解碼方式帶來良好的語言建模能力,但解碼過程卻相當耗時,在資源有限的條件下不利於現實生活中的應用;針對此問題,本論文同時也探討了語碼轉換和語音翻譯的非自回歸模型,以期以更快的速度得到良好的模型表現。
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/79234
DOI: 10.6342/NTU202200129
Fulltext Rights: 同意授權(全球公開)
Appears in Collections:電信工程學研究所

Files in This Item:
File SizeFormat 
U0001-2101202201531800.pdf3.96 MBAdobe PDFView/Open
Show full item record


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved