請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/98656| 標題: | 利用品質感知的多層池化方法強化文本嵌入 Enhancing Text Embeddings with Quality-Aware Multi-Layer Pooling |
| 作者: | 蕭襄 Hsiang Hsiao |
| 指導教授: | 林守德 Shou-De Lin |
| 共同指導教授: | 葉彌妍 Mi-Yen Yeh |
| 關鍵字: | 文本嵌入,大型語言模型,多層池化,品質感知,下游任務, Text Embedding,Large Language Models,Multi-Layer Pooling,Quality-Aware,Downstream Tasks, |
| 出版年 : | 2025 |
| 學位: | 碩士 |
| 摘要: | 文本嵌入在各種自然語言處理任務中扮演關鍵角色。近期多項研究聚焦於以大型語言模型為基礎的文本嵌入方法,並在多種下游任務中展現出卓越的效能。然而,這些方法大多僅使用模型的最後一層來提取嵌入,而有研究指出,最後一層未必能提供最佳表示。為此,本研究提出一種結合多層資訊的品質感知池化方法,根據每一層的品質指標自動分配權重,以生成更具表現力的文本嵌入。實驗結果顯示,所提方法在多數下游任務中皆能提升性能,驗證其有效性與泛化能力。 Text embeddings play a crucial role in various natural language processing tasks. Recent studies have focused on using large language models (LLMs) to generate high-quality embeddings, achieving remarkable performance on a wide range of downstream tasks. However, most existing methods rely solely on the final layer of the model to extract embeddings, despite evidence suggesting that the last layer may not always provide the most informative representation. To address this, we propose a quality-aware multi-layer pooling approach that integrates information from all layers and assigns weights based on layer-wise quality scores. Experimental results demonstrate that our method consistently improves performance across multiple downstream tasks, validating its effectiveness and generalizability. |
| URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/98656 |
| DOI: | 10.6342/NTU202503533 |
| 全文授權: | 同意授權(全球公開) |
| 電子全文公開日期: | 2025-08-18 |
| 顯示於系所單位: | 資料科學學位學程 |
文件中的檔案:
| 檔案 | 大小 | 格式 | |
|---|---|---|---|
| ntu-113-2.pdf | 575.44 kB | Adobe PDF | 檢視/開啟 |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。
