Please use this identifier to cite or link to this item:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/71401| Title: | 以生成對抗網路自動產生中英文語碼轉換文句 Chinese-English Code-switching Sentence Generation by Generative Adversarial Networks |
| Authors: | Ching-Ting Chang 張瀞婷 |
| Advisor: | 李琳山 |
| Keyword: | 語碼轉換,文本生成,資料增強,語言模型,生成對抗網路, code-switching,text generation,data augmentation,language modeling,generative adversarial networks, |
| Publication Year : | 2019 |
| Degree: | 碩士 |
| Abstract: | 語碼轉換是指在一段話或是一段文字中交替使用兩種以上語言。基本上不同語者、不同對話內容、不同語言組合都可能有不同的語碼轉換風格與特性。雖然語碼轉換在自然語言中出現頻繁,但相較於單一語言,語碼轉換的語料相當缺乏。
本論文目標是發展一種非監督式的技術來自動產生語碼轉換的語料,並在兩套中文為主位語言、英文為客位語言的語碼轉換資料集上實驗驗證。本論文的方法是藉由生成對抗網路以及梯度策略演算法,從單一語言的文句 (主位語言) 預測適合的語碼轉換位置,將這些位置以詞翻譯為客位語言後產生句內語碼轉換的文句,並用以作為語言模型的增強訓練語料。結果顯示本論文所提出的方式能夠小幅度改善語言模型,並小幅降低語音辨識系統的客位語言的錯誤率。 |
| URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/71401 |
| DOI: | 10.6342/NTU201900420 |
| Fulltext Rights: | 有償授權 |
| Appears in Collections: | 電信工程學研究所 |
Files in This Item:
| File | Size | Format | |
|---|---|---|---|
| ntu-108-1.pdf Restricted Access | 1.67 MB | Adobe PDF |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
