Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資訊工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/72707
標題: 語意一致地自動生成中文新聞的標題
Semantically Consistent Title Generation for Chinese News Articles
作者: Cheng-Hsuan Wu
吳政軒
指導教授: 鄭卜壬(Pu-Jen Cheng)
關鍵字: 標題生成,自然語言處理,語意一致性,注意力機制,Pointer-Generator,
Title Generation,Natural Language Processing,Semantic Consistent,Attention Mechanism,Pointer-Generator,
出版年 : 2019
學位: 碩士
摘要: 在過去幾年裡,很多類神經網路模型,像是各種sequence-to-sequence的變形在標題生成這方面有了很大的進展。Pointer-Generator就是其中一個具有代表性的模型,在機器翻譯、概要、標題生成等等自然語言處理的任務都有不錯的表現。然而,這些模型常常有一個問題,就是生成標題的語意和文章重點的語意不太一致,尤其在中文的任務更是明顯。在這篇論文裡,為了解決上述的問題,我們提出兩個方法加在Pointer-Generator模型上。第一,我們藉由告知模型上一個時間點的上下文語意,改善了注意力機制,讓模型在掌握當前部分的語意後可以注意到其他部分,避免再繼續抄整個句子,那些句子裡可能含有一些比較不重要的資訊。第二,我們針對編碼器加了一些限制,讓他對文章編碼時,可以保有較多的語意資訊。我們將提出的模型應用在兩個台灣新聞報社的中文資料集,結果顯示我們的模型不管是在ROUGE分數上或是人類評估的結果,表現都比Pointer-Generator好。
In the past years, various neural sequence-to-sequence models for title generation have made considerable progresses. Pointer-Generator is one of the representative models recently on many natural language processing tasks, such as machine translation, summarization, title generation and so on. However, these models usually suffer from semantic inconsistency between a generated title and the article, especially for Chinese title generation. In this paper, we propose two methods which augment Pointer-Generator to tackle the issue. First, we improve the attention mechanism by informing model the previous context semantic. By doing so, our model can attend to other parts when it has already got the meanings of the current part. It can prevent model from continuous coping the whole sentence, which probably contains less important information. Second, we add a constraint to the encoder so that it can encode the article with more important semantic information. We apply our model to the two Chinese news datasets collected from two newspaper offices in Taiwan, outperforming Pointer-Generator on both ROUGE scores and the human evaluation.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/72707
DOI: 10.6342/NTU201901724
全文授權: 有償授權
顯示於系所單位:資訊工程學系

文件中的檔案:
檔案 大小格式 
ntu-108-1.pdf
  目前未授權公開取用
1.78 MBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved