| 【中文题名】 | 基于协同进化与强化学习的多代理协作学习研究 |
| 【英文题名】 | The Research of Multi-agent Cooperation Learning Based on Co-evolutionary and Reinforcement Learning |
| 【学科专业】 | 管理科学与工程 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2007-9-20 |
| 【中关键词】 | 协同进化,进化稳定遗传算法,策略重用方法,随机博弈,强化学习, |
| 【英关键词】 | co-evolutionary,evolutionarily stable genetic algorithm,policy reuse method,stochastic game,reinforcement learning, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>自动化基础理论>人工智能理论>> |
| 【论文摘要】 |
在多Agent系统中,由于环境是动态变化的,其他Agent行为是未知的,要建立领域完备的先验模型几乎不可能,而且许多领域知识也是在Agent和其他Agent交互的过程中逐步获得的,所以复杂环境下的Agent应当能够根据以前的经验校正其行为,即具有学习或自适应能力。学习技术在多Agent系统中的应用显得尤为重要。与此同时,单个Agent常常由于其有限的资源和能力,不能完成复杂的任务,所以多个Agent之间的协作也非常必要。增加学习机制是实现不同Agent之间协作的有效解决方法之一,一方面,为多Agent系统增加学习机制可以有效地实现Agent间的协作;另一方面,为Agent系统增加协作机制也能改善多Agent的学习性能。
本文首先回顾Agent及多Agent系统产生、研究基础以及多Agent系统学习方法,分别从多Agent协作、强化学习、多Agent强化学习三个方面讲述多Agent协作学习的基础知识。本文将协同进化与进化稳定遗传算法相结合,并应用于多Agent系统的行动选择问题。在由两个或更多群体组成的系统中,每个群体分别代表一个Agent,系统中每个物种在其群体内进行进化,并通过反复使用进化... |
| 【论文题纲】 |
|
摘要 |
5-6 |
|
ABSTRACT |
6-8 |
|
第一章 引言 |
8-14 |
|
1.1 研究背景和意义 |
8-9 |
|
1.2 AGENT 与多AGENT系统 |
9-14 |
|
第二章 预备知识 |
14-30 |
|
2.1 多AGENT协作 |
14-17 |
|
2.2 强化学习 |
17-23 |
|
2.3 多AGENT强化学习方法 |
23-30 |
|
第三章 协同进化多AGENT 系统 |
30-36 |
|
3.1 协同进化遗传算法与进化稳定策略相结合 |
31-32 |
|
3.2 协同进化多AGENT系统 |
32-34 |
|
3.3 协同进化多AGENT系统适应度仿真实验 |
34-35 |
|
3.4 结论 |
35-36 |
|
第四章 基于随机博弈与强化学习的多AGENT 协作学习 |
36-44 |
|
4.1 现有搜索策略方法 |
37-38 |
|
4.2 策略重用方法及定义 |
38 |
|
4.3 实验环境 |
38-42 |
|
4.4 结果分析 |
42-44 |
|
第五章 结束语 |
44-46 |
|
5.1 总结 |
44 |
|
5.2 进一步工作 |
44-46 |
|
参考文献 |
46-50 |
|
攻读硕士学位期间发表的论文 |
50-51 |
|
致谢 |
51 |
|
| 【DOI】 | LunWen.ID:2.2008.388851 |