請用此 Handle URI 來引用此文件:
http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/6202
標題: | 學習行為系統用於自動機代理人 Auto-agent with Learned Behaviors |
作者: | Shin-Rong Huang 黃信榮 |
指導教授: | 劉長遠(Cheng-Yuan Liou) |
關鍵字: | 自動機代理人,機器學習, Behavior system,Reinforcement learning, |
出版年 : | 2013 |
學位: | 碩士 |
摘要: | 我們使用Blumberg的Model來實作出可以自動交易的agent,除此之外,我們加入了learning mechanism來讓agent擁有學習的功能,在learning mechanism 方面,我們implement Q-learning來讓agent可以根據每次的交易結果修正自己的Rule table,最後agent可以完成交易。
在Blumberg的Model裡面,Internal Variable一直扮演很重要的角色,它可以讓agent擁有類似人類的情緒或是慾望,例如如果agent對於時間很渴望的話,換句話說,希望交易可以在最短的時間裡完成,那麼它就會對於價格的堅持較沒有那麼顯著;相反的,如果agent對於價格的渴望較高的話,意思是說,不希望價格降低或是提高太多,那麼就算花較長的時間,價格的讓步還是有限,因此,我們選擇 Internal Variable 來做為學習(learning) 的參數。 我們選擇要實作的Blumberg的Model擁有四個不同的component。Internal Variable(IV) 是用來建構內在狀態,就如我們上段所說,可以根據不同時間下的growth rate and damping rate 和根據正在表現的行為而產生的影響來改變。Releasing Mechanism (RM) 是用來感知外在的刺激,它可以根據每個agent而擁有不同的感知能力。Level of Interest (LI) 是用來建構當時行為所發生的影響。IV、RM、LI這三個component綜合起來決定最後agent選擇哪一個Behavior。在選擇Behavior 的時候,我們會設定一個gain,如果有超過一個以上的Behavior不為零,我們就會利用gain來降低每個Behavior的值,直到出現只有一個Behavior的值不為零為止。 In this paper, we present an agent-based electronic marketplace and the desired agents for negotiation. These agents will negotiate with each other in a human-like way. We implement the Blumberg's model and using reinforcement learning mechanism. We use Q-learning to train the internal variables of the agent. The behavior model with Q-Learning, which we propose, can adapt to many environments, such as finance , database, electronic marketplace, and transaction of stock. We will show the experiment of implementation for electronic marketplace. |
URI: | http://tdr.lib.ntu.edu.tw/jspui/handle/123456789/6202 |
全文授權: | 同意授權(全球公開) |
顯示於系所單位: | 資訊工程學系 |
文件中的檔案:
檔案 | 大小 | 格式 | |
---|---|---|---|
ntu-102-1.pdf | 4.63 MB | Adobe PDF | 檢視/開啟 |
系統中的文件,除了特別指名其著作權條款之外,均受到著作權保護,並且保留所有的權利。