Skip navigation

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料(如:文字、圖片、PDF)並使其易於取用。

點此認識 DSpace
DSpace logo
English
中文
  • 瀏覽論文
    • 校院系所
    • 出版年
    • 作者
    • 標題
    • 關鍵字
    • 指導教授
  • 搜尋 TDR
  • 授權 Q&A
    • 我的頁面
    • 接受 E-mail 通知
    • 編輯個人資料
  1. NTU Theses and Dissertations Repository
  2. 工學院
  3. 機械工程學系
請用此 Handle URI 來引用此文件: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/99177
標題: 基於 TD3 演算法與模糊獎勵系統的 PD 控制器參數最 佳化之設計與應用
Design and Application of PD Controller Parameter Optimization using TD3 Algorithm with Fuzzy Reward System
作者: 羅漢為
Carlos Javier Espinola Rotela
指導教授: 黃漢邦
Han-Pang Huang
關鍵字: 機器人操作臂,模糊邏輯控制,強化學習,自調式控制器,TD3 演算 法,位置與力的追蹤,自適應控制,比例微分控制,即時控制,動態環境,控制參數最佳化,
Robotic Manipulator,Fuzzy Logic Control,Reinforcement Learning,Self-Tuning Controller,TD3 Algorithm,Position and Force Tracking,Adaptive Control,Proportional-Derivative Control,Real-time Control,Dynamic Environment,Control Parameter Optimization,
出版年 : 2025
學位: 碩士
摘要: 改善機器人操控器的效能與運動精確性,一直是控制系統領域中的重要研究主題之一。本文提出了一種應用於六自由度機器人操控器的自適應控制架構設計,目的是提升其在變動環境中的追蹤能力與反應效率。此控制系統整合了強化學習與模糊邏輯技術,以實現即時調整比例-微分(PD)控制器的控制參數。所設計的模糊獎勵機制可用於即時評估整體控制表現,考慮因素包括偏差大小、其變化速率以及施加的控制力。該模糊評估系統結合了 TD3(Twin Delayed Deep Deterministic Policy Gradient)強化學習演算法,這是一種基於actor-critic架構的先進策略學習方法。透過與外部環境的互動,系統能逐步學習出最適的控制策略,並根據模糊獎勵提供的回饋來調整 PD 控制器的增益設定。在 Simulink 環境中結合 MATLAB 工具箱所進行的模擬實驗,驗證了該控制器的有效性。透過對六自由度機器手臂的實驗,展示了其在實際應用中的控制表現。這些模擬比較了結合模糊邏輯與強化學習的自適應控制策略與傳統固定增益PID控制器之間的性能差異。結果顯示,該創新方法在追蹤精度方面有顯著提升,且更能適應系統動態的變化。此一控制框架在機器人手臂及其他複雜機電系統的自主控制領域中,具備潛在的應用價值與貢獻。
Improving the performance and accuracy of robotic manipulators has been a very important research areas in control systems engineering. This article presents the development of an adaptive control framework for a six-DOF robotic manipulator, aiming to improve its motion accuracy and responsiveness in a dynamic environment. The proposed controller focuses on the online tuning of a proportional derivative controller parameters combining reinforcement learning with fuzzy logic. The fuzzy reward system is designed to evaluate system performance in real time, considering error, error rate, and applied control force. Fuzzy rewards are combined with a reinforcement learning method, the Twin Delayed Deep Deterministic Policy Gradient algorithm operates using an actor-critic methodology. TD3 lets the system achieve a better control policy which engages with the environment and adjusts the PD controller’s gains based on feedback from fuzzy rewards. The simulations conducted in Simulink with the use of Matlab toolboxes confirmed the efficacy of the controller. The experiments done with the six-DOF robot arm showed its performance in real-life applications. These simulations assessed the performance of an adaptive control strategy that utilizes fuzzy logic and reinforcement learning against a conventional fixed-gain PID controller. The findings indicated that the novel approach notably enhanced tracking precision and adaptability to changes in system dynamics. This control framework could potentially contribute in the area of autonomous control systems for robotic arms and other intricate mechatronic systems.
URI: http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/99177
DOI: 10.6342/NTU202503257
全文授權: 未授權
電子全文公開日期: N/A
顯示於系所單位:機械工程學系

文件中的檔案:
檔案 大小格式 
ntu-113-2.pdf
  未授權公開取用
19.42 MBAdobe PDF
顯示文件完整紀錄


系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。

社群連結
聯絡資訊
10617臺北市大安區羅斯福路四段1號
No.1 Sec.4, Roosevelt Rd., Taipei, Taiwan, R.O.C. 106
Tel: (02)33662353
Email: ntuetds@ntu.edu.tw
意見箱
相關連結
館藏目錄
國內圖書館整合查詢 MetaCat
臺大學術典藏 NTU Scholars
臺大圖書館數位典藏館
本站聲明
© NTU Library All Rights Reserved