學習行為系統用於自動機代理人

Shin-Rong Huang; 黃信榮

請用此 Handle URI 來引用此文件： http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/6202

標題:	學習行為系統用於自動機代理人 Auto-agent with Learned Behaviors
作者:	Shin-Rong Huang 黃信榮
指導教授:	劉長遠(Cheng-Yuan Liou)
關鍵字:	自動機代理人,機器學習, Behavior system,Reinforcement learning,
出版年 :	2013
學位:	碩士
摘要:	我們使用Blumberg的Model來實作出可以自動交易的agent，除此之外，我們加入了learning mechanism來讓agent擁有學習的功能，在learning mechanism 方面，我們implement Q-learning來讓agent可以根據每次的交易結果修正自己的Rule table，最後agent可以完成交易。在Blumberg的Model裡面，Internal Variable一直扮演很重要的角色，它可以讓agent擁有類似人類的情緒或是慾望，例如如果agent對於時間很渴望的話，換句話說，希望交易可以在最短的時間裡完成，那麼它就會對於價格的堅持較沒有那麼顯著；相反的，如果agent對於價格的渴望較高的話，意思是說，不希望價格降低或是提高太多，那麼就算花較長的時間，價格的讓步還是有限，因此，我們選擇 Internal Variable 來做為學習(learning) 的參數。我們選擇要實作的Blumberg的Model擁有四個不同的component。Internal Variable(IV) 是用來建構內在狀態，就如我們上段所說，可以根據不同時間下的growth rate and damping rate 和根據正在表現的行為而產生的影響來改變。Releasing Mechanism (RM) 是用來感知外在的刺激，它可以根據每個agent而擁有不同的感知能力。Level of Interest (LI) 是用來建構當時行為所發生的影響。IV、RM、LI這三個component綜合起來決定最後agent選擇哪一個Behavior。在選擇Behavior 的時候，我們會設定一個gain，如果有超過一個以上的Behavior不為零，我們就會利用gain來降低每個Behavior的值，直到出現只有一個Behavior的值不為零為止。 In this paper, we present an agent-based electronic marketplace and the desired agents for negotiation. These agents will negotiate with each other in a human-like way. We implement the Blumberg's model and using reinforcement learning mechanism. We use Q-learning to train the internal variables of the agent. The behavior model with Q-Learning, which we propose, can adapt to many environments, such as finance , database, electronic marketplace, and transaction of stock. We will show the experiment of implementation for electronic marketplace.
URI:	http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/6202
全文授權:	同意授權(全球公開)
顯示於系所單位：	資訊工程學系

文件中的檔案：

檔案	大小	格式
ntu-102-1.pdf	4.63 MB	Adobe PDF	檢視/開啟

顯示文件完整紀錄

系統中的文件，除了特別指名其著作權條款之外，均受到著作權保護，並且保留所有的權利。

DSpace

機構典藏 DSpace 系統致力於保存各式數位資料（如：文字、圖片、PDF）並使其易於取用。