請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/71401| 標題: | 以生成對抗網路自動產生中英文語碼轉換文句 Chinese-English Code-switching Sentence Generation by Generative Adversarial Networks |
| 作者: | Ching-Ting Chang 張瀞婷 |
| 指導教授: | 李琳山 |
| 關鍵字: | 語碼轉換,文本生成,資料增強,語言模型,生成對抗網路, code-switching,text generation,data augmentation,language modeling,generative adversarial networks, |
| 出版年 : | 2019 |
| 學位: | 碩士 |
| 摘要: | 語碼轉換是指在一段話或是一段文字中交替使用兩種以上語言。基本上不同語者、不同對話內容、不同語言組合都可能有不同的語碼轉換風格與特性。雖然語碼轉換在自然語言中出現頻繁,但相較於單一語言,語碼轉換的語料相當缺乏。
本論文目標是發展一種非監督式的技術來自動產生語碼轉換的語料,並在兩套中文為主位語言、英文為客位語言的語碼轉換資料集上實驗驗證。本論文的方法是藉由生成對抗網路以及梯度策略演算法,從單一語言的文句 (主位語言) 預測適合的語碼轉換位置,將這些位置以詞翻譯為客位語言後產生句內語碼轉換的文句,並用以作為語言模型的增強訓練語料。結果顯示本論文所提出的方式能夠小幅度改善語言模型,並小幅降低語音辨識系統的客位語言的錯誤率。 |
| URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/71401 |
| DOI: | 10.6342/NTU201900420 |
| 全文授權: | 有償授權 |
| 顯示於系所單位: | 電信工程學研究所 |
文件中的檔案:
| 檔案 | 大小 | 格式 | |
|---|---|---|---|
| ntu-108-1.pdf 未授權公開取用 | 1.67 MB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。
