Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資料科學學位學程
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/84106
標題: 誠實標題黨:具吸引力且忠於事實的新聞標題產生器
HonestBait: Generating Attractive Headlines via Faithful Forward-Referencing
作者: Chih-Yao Chen
陳知遙
指導教授: 古倫維(Lun-Wei Ku)
共同指導教授: 陳信希(Hsin-Hsi Chen)
關鍵字: 文本生成,標題生成,強化式學習,
Text Generation,Headline Generation,Reinforcement Learning,
出版年 : 2022
學位: 碩士
摘要: 隨著網際網路與社群媒體的興起,資訊產生及傳播的速度也不停的在增長。假新聞儼然成為了這個世代重要的議題之一,而其中一種對抗假新聞的方法,就是撰寫澄清新聞來核實不正確的資訊。然而澄清新聞的主要目的在於闢謠,使用的口吻時常過於平淡,容易導致讀者喪失興趣,而使點閱率與假新聞相比較低。 與此同時,深度學習的發展不斷的在縮小諸多任務中機器與人之間的距離,語言模型的成熟使得自動生成文章的摘要或標題變得可能,許多研究也以此為方向,希望能夠讓機器來幫助人們撰寫文案。過去的研究主要以點擊率為依據,也是判斷一個新聞是否具有吸引力的唯一指標,卻可能忽略了新聞事件本身也可能是造成點擊率高的原因之一,因此若以這樣的標準收集資料並訓練模型,反而可能使得真正具有吸引力的標題成為噪音而影響模型的表現。 在這個研究中,我們先透過讀者研究,分析具吸引力的標題所具備的風格,及其在真假新聞之間的差異;接著我們讓模型透過假新聞資料學習出產生具吸引力標題的能力,再計算產生標題的聳動程度及真實程度,並以強化式學習的方法來更新整個框架。實驗結果顯示我們的方法能夠在吸引力、真實性取得顯著的進步,並在不損失流暢性的情況下擊敗多個過去最優的語言生成模型。
The dissemination of fake news has already become a major issue in this century, thanks to the rapid growth of the internet and social media platforms. One typical strategy for combating fake news is to release verified news. However, most verified news uses a monotonic tone to point out the fact, which loses readers interest and thus being less effective. Current methods for generating attractive headlines often learn directly from data, which bases attractiveness on the number of user clicks and views. Although clicks or views do reflect user interest, they can fail to reveal how much interest is raised by the writing style and how much is caused by the event or topic itself. Also, such approaches can lead to harmful hallucinations by over-exaggerating the content, aggravating the spread of false information. In this work, we propose HonestBait, a novel framework for solving these issues from another aspect: generating headlines using forward references(FRs), a writing technique often used in clickbait. A self-verification process is also included to avoid harmful hallucinations. Automatic metrics and human evaluations show our framework yields better results in attractiveness while maintaining high veracity.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/84106
DOI: 10.6342/NTU202201473
全文授權: 同意授權(限校園內公開)
電子全文公開日期: 2022-07-26
顯示於系所單位:資料科學學位學程

文件中的檔案:
檔案 大小格式 
U0001-1407202223212600.pdf
授權僅限NTU校內IP使用(校園外請利用VPN校外連線服務)
1.1 MBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved