Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資訊工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/96041
標題: 基於可學習編碼簿之大型語言模型提示詞微調
Prompt Tuning of Large Language Models Based on Learnable Codebooks
作者: 林昱辰
Yu-Chen Lin
指導教授: 陳祝嵩
Chu-Song Chen
關鍵字: 輕量化微調,提示詞微調,乘積量化,深度學習,遷移式學習,
Parameter Efficient Fine-tuning,Prompt Tuning,Product Quantization,Deep Learning,Transfer Learning,
出版年 : 2024
學位: 碩士
摘要: 提示詞微調是一種熱門的輕量化微調架構,其特點是在預訓練模型的基礎上僅更新少量參數,即可達到亮眼的表現。在過去的方法中,每個提示詞通常被視為一個整體,且各自獨立更新,導致隨著提示詞的增多,更新的參數量也線性增長。為了解決此問題,我們提出了高效率提示詞微調的可適應性編碼簿。我們利用了乘積量化的概念,使提示詞在每個分割後的子空間中共享一組可學習的編碼向量。每個提示詞透過一組自適應權重而有所變化。我們在 17 個自然語言任務中,僅更新預訓練模型 0.3% 的參數,就達到了優異的表現,包括自然語言理解及問答任務。此外,我們的方法在少樣本學習情境以及大型語言模型骨幹下也有良好表現,凸顯了其適應性及可發展性。
Prompt Tuning has emerged as a popular Parameter-Efficient Fine-Tuning method attributed to its excellent performance with few updated parameters on various large-scale Pretrained Language Models (PLMs). In previous approaches, each prompt has been considered as a whole and updated independently, causing all parameters to depend on prompt length and increase accordingly. To alleviate this problem, we introduce Adaptive Codebook for Composite and Efficient Prompt Tuning (ACCEPT). In our approach, we utilize the concept of product quantization (PQ), enabling all soft prompts to share a common set of learnable codebook vectors within each subspace. Each prompt is then distinguished by a unique set of adaptive weights. We achieve impressive performances on 17 diverse natural language tasks, including natural language understanding (NLU) and question answering (QA), by training only 0.3% of parameters of the PLMs. Additionally, our method excels in fewshot and large model scenarios, highlighting its significant adaptability and potential.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/96041
DOI: 10.6342/NTU202402283
全文授權: 同意授權(限校園內公開)
電子全文公開日期: 2025-09-01
顯示於系所單位:資訊工程學系

文件中的檔案:
檔案 大小格式 
ntu-112-2.pdf
授權僅限NTU校內IP使用(校園外請利用VPN校外連線服務)
604.8 kBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved