請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/81920| 標題: | 發展以三元組為基礎的知識圖譜與文章摘要萃取技術 On the Development of Knowledge Graph and Text Summarization Technology Based on Triplet Extraction |
| 作者: | Min-Hsiang Yang 楊閔翔 |
| 指導教授: | 藍俊宏 (Jackey Blue) |
| 關鍵字: | 萃取式摘要,斷詞,知識圖譜,關鍵字擷取,N元語法,三元組,主詞-動詞-賓語,召回率導向的摘要評估, Extractive Abstract,Tokenization,Knowledge Graph,Keyword Extraction,N-gram,Triplets,Subject-Verb-Object,Recall-Oriented Understudy for Gisting Evaluation (ROUGE),ROUGE, |
| 出版年 : | 2021 |
| 學位: | 碩士 |
| 摘要: | 由於資訊科技的進步,資料的蒐集變得非常容易,導致人類消化資訊的速度遠比不上資料生成的速度,如何從海量的資料中,快速且正確的擷取出有用的資訊,無論在哪個領域中都是非常重要。 本論文以「萃取式摘要」與「摘要知識圖譜」為目標,提出萃取式摘要的泛化改良流程。在不引入語系或領域的完整字典下,從文章內容自製暫用辭典,輔以N-gram尋找關鍵詞,藉此產生知識圖譜所需的三元組,即如中文的主詞、動詞、賓語 (SVO) 的概念,最後以關鍵字與三元組出現的頻率為權重標準,挑選關鍵詞與句,再彙整為萃取式摘要。 為驗證提出之方法,本論文以內容農場、27篇學術論文與18篇期刊論文進行測試,以原文章之摘要為標準進行ROUGE-1、2、L的計算,並與TextRank摘取之結果相比。在單篇平均六萬字的27篇論文且同時包含中英文文字下,無論移除或不移除停止字,平均每篇可得到ROUGE-1、2、L平均分為0.44、0.18與0.37,約為TextRank的3倍,可在29秒內處理完畢,速度為TextRank的142秒的5倍速度;在期刊與內容農場之文章也有類似之成果。摘要後以三元組繪製知識圖譜,視覺化呈現單篇文章摘要,可更有效率地理解文章關鍵字之間的關係。 |
| URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/81920 |
| DOI: | 10.6342/NTU202103357 |
| 全文授權: | 同意授權(全球公開) |
| 電子全文公開日期: | 2026-09-25 |
| 顯示於系所單位: | 工業工程學研究所 |
文件中的檔案:
| 檔案 | 大小 | 格式 | |
|---|---|---|---|
| U0001-2509202113132400.pdf 此日期後於網路公開 2026-09-25 | 3.36 MB | Adobe PDF |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。
