Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 工學院
  3. 工業工程學研究所
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/97826
標題: 主題模型強化之短文本檢索與生成品質提升
Enhancing Retrieval and Generation Quality for Short Texts with Topic Models
作者: 黎家愷
Chia-Kai Li
指導教授: 郭瑞祥
Ruey-Shan Guo
關鍵字: 資訊檢索,自然語言處理,檢索增強生成,主題建模,大型語言模型,
Information Retrieval,Natural Language Processing,Retrieval-Augmented Generation,Topic Modeling,Large Language Models,
出版年 : 2025
學位: 碩士
摘要: 檢索增強生成(RAG)的效能在很大程度上取決於檢索階段的品質。傳統的RAG 系統主要依賴向量相似度匹配,卻無法完美捕捉查詢與文檔之間的潛在主題結構,導致檢索結果不理想。為了解決這個問題,本研究在 RAG 的檢索階段引入主題建模(透過 BERTopic 流程 ),對 Amazon 產品評論進行主題聚類,並利用查詢重寫來判定查詢的主題 。透過將檢索範圍限定於相關主題,我們的方法能有效過濾無關文檔,提升檢索精度,並進一步改善下游文本生成的品質。我們在多個檢索基準數據集上進行實驗評估,結果顯示,相較於傳統的向量檢索方法(Naive RAG),BERTopic 檢索策略在檢索相關度與 RAG 的整體表現方面均有顯著提升。
The effectiveness of Retrieval-Augmented Generation (RAG) largely depends on the quality of the retrieval stage. Traditional RAG systems primarily rely on vector similarity matching, which cannot perfectly capture the underlying thematic structure between queries and documents, leading to suboptimal retrieval results. To address this issue, this study introduces topic modeling (via the BERTopic process) in the RAG retrieval phase, performs topic clustering on Amazon product reviews, and utilizes query rewriting to determine the topics of queries. By restricting the retrieval scope to relevant topics, our approach effectively filters out irrelevant documents, enhances retrieval precision, and further improves the quality of downstream text generation. We conducted experimental evaluations on multiple retrieval benchmark datasets, and the results indicate that, compared to traditional vector-based retrieval methods (Naive RAG), the BERTopic retrieval strategy significantly improves both retrieval relevance and the overall performance of RAG.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/97826
DOI: 10.6342/NTU202501611
全文授權: 未授權
電子全文公開日期: N/A
顯示於系所單位:工業工程學研究所

文件中的檔案:
檔案 大小格式 
ntu-113-2.pdf
  未授權公開取用
9.03 MBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved