Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 電機資訊學院
  3. 資訊工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/88092
標題: 具有共享及獨特特徵和優先權經驗回放的多任務強化學習
Multi­-Task Reinforcement Learning with Shared-­Unique Features and Task-­Aware Prioritized Experience Replay
作者: 林柏劭
Po-Shao Lin
指導教授: 徐宏民
Winston Hsu
關鍵字: 多任務強化學習,經驗回放,共享-獨特特徵,機器人學,深度學習,
Multi­-Task Reinforcement Learning,Experience Replay,Shared-­Unique Features,Robotics,Deep Learning,
出版年 : 2023
學位: 碩士
摘要: 多任務強化學習已成為一個具有挑戰性的問題,旨在減少強化學習的計算成本並利用任務之間的共享特徵來提高個別任務的性能。然而,一個關鍵挑戰在於確定應該在任務之間共享哪些特徵以及如何保留區分每個任務的獨特特徵。這個挑戰常常導致任務性能不平衡的問題,其中某些任務可能主導學習過程,而其他
任務則被忽視。在本文中,我們提出了一種新方法,稱為共享­獨特特徵和任務感知的優先經驗重放,以提高訓練穩定性並有效利用共享和獨特特徵。我們引入了一種簡單而有效的任務特定嵌入方法,以保留每個任務的獨特特徵,以減輕任務性能不平衡的潛在問題。此外,我們將任務感知設置引入到優先經驗重放算法中,以適應多任務訓練並增強訓練的穩定性。我們的方法在 Meta­World 的資料測試集中實現了最先進的平均成功率,同時在所有任務上保持穩定的性能,避免了任務性能不平衡的問題。結果證明了我們的方法在應對多任務強化學習挑戰方面的有效性。
Multi-task reinforcement learning (MTRL) has emerged as a challenging problem to reduce the computational cost of reinforcement learning and leverage shared features among tasks to improve the performance of individual tasks.
However, a key challenge lies in determining which features should be shared across tasks and how to preserve the unique features that differentiate each task. This challenge often leads to the problem of task performance imbalance, where certain tasks may dominate the learning process while others are neglected.
In this paper, we propose a novel approach called shared-unique features along with task-aware prioritized experience replay to improve training stability and leverage shared and unique features effectively.
We incorporate a simple yet effective task-specific embeddings to preserve the unique features of each task to mitigate the potential problem of task performance imbalance.
Additionally, we introduce task-aware settings to the prioritized experience replay (PER) algorithm to accommodate multi-task training and enhancing training stability.
Our approach achieves state-of-the-art average success rates on the Meta-World benchmark, while maintaining stable performance across all tasks, avoiding task performance imbalance issues. The results demonstrate the effectiveness of our method in addressing the challenges of MTRL.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/88092
DOI: 10.6342/NTU202301033
全文授權: 同意授權(限校園內公開)
電子全文公開日期: 2028-07-11
顯示於系所單位:資訊工程學系

文件中的檔案:
檔案 大小格式 
ntu-111-2.pdf
  未授權公開取用
4.26 MBAdobe PDF檢視/開啟
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved