| 【中文题名】 | 基于改进强化学习算法的神经模糊控制器的设计与实现 |
| 【英文题名】 | A Neuro-Fuzzy Controller Based on Improved Reinforcement Learning |
| 【学科专业】 | 计算机软件与理论 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2007-7-19 |
| 【中关键词】 | 模糊控制,神经模糊控制系统,线性搜索,强化学习,, |
| 【英关键词】 | Fuzzy Control,Neuro-fuzzy control system,Linear Search,Reinforcement Learning, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>自动化基础理论>人工智能理论>人工神经网络与计算> |
| 【论文摘要】 |
模糊控制和神经网络技术是人工智能系统中两种重要的理论,虽然它们从属于两个截然不同的学科领域,其基础理论也相差较远,但是它们都能模拟人的智能行为,从而解决不确定、非线性、复杂的自动化问题。神经网络与模糊推理的融合可以解决各自在信息处理与控制中存在的不足,并通过互补构造出功能更加完善、更加智能化的系统。
神经模糊控制系统就是两个学科相互融合的产物,神经网络的并行处理能力和学习能力为智能控制领域注入了新的活力,同时也提出了新的问题。
一方面,在引入了模糊量之后,节点需要进行精确数值计算和模糊计算的转化,使得神经元在输入量和输出量之间的传递函数变得更加复杂,对神经模糊控制系统的硬件实现提出了极大的挑战。针对这个问题,本文中提出了一种新型的单向线性响应(Unidirectional Linear Response)神经元,通过ULR单元可将神经模糊网络中各层神经元的不同的传递函数进行转化,从而将神经模糊控制器中的神经元全部转变为同一种神经元,这样使神经模糊控制器的节点类型变得单一化,硬件实现变得相对简单。
另一方面,在神经模糊控制中应该选用什么样的学习算法呢?传统反向传播(Back-p... |
| 【论文题纲】 |
|
摘要 |
8-10 |
|
ABSTRACT |
10-12 |
|
第1章 绪论 |
12-15 |
|
1.1 研究背景 |
12-13 |
|
1.2 主要研究内容 |
13-15 |
|
第2章 模糊控制、神经网络和神经模糊控制器 |
15-23 |
|
2.1 模糊控制技术 |
15-19 |
|
2.2 神经网络和模糊神经网络 |
19-20 |
|
2.3 神经模糊控制(Neuro-Fuzzy Control) |
20-22 |
|
2.4 本章小结 |
22-23 |
|
第3章 模糊神经元设计及控制器的硬件实现原理 |
23-35 |
|
3.1 单向线性响应单元ULR |
23-25 |
|
3.2 以三角形函数为隶属函数的神经模糊控制器的ULR实现 |
25-31 |
|
3.2.1 模糊量化处理(模糊隶属函数) |
26-28 |
|
3.2.2 模糊控制规则 |
28-29 |
|
3.2.3 解模糊化(Defuzzification) |
29-31 |
|
3.3 以梯形函数为隶属函数的神经模糊控制器的ULR实现 |
31-34 |
|
3.3.1 梯形函数的模糊量化处理 |
31-32 |
|
3.3.2 梯形函数的解模糊化 |
32-34 |
|
3.4 本章小结 |
34-35 |
|
第4章 神经模糊控制器的学习算法 |
35-47 |
|
4.1 学习算法概述 |
35-37 |
|
4.2 强化学习与线性搜索算法相结合的学习算法 |
37-44 |
|
4.2.1 算法的基本思想和流程 |
37-40 |
|
4.2.2 Fibonacci Search算法和黄金搜索法 |
40-43 |
|
4.2.3 Brent算法 |
43-44 |
|
4.3 对基于Fibonacci Search方法的强化学习的改进 |
44-46 |
|
4.4 本章小结 |
46-47 |
|
第5章 倒立振子平衡控制系统仿真实验 |
47-55 |
|
5.1 倒立振子平衡控制系统 |
47 |
|
5.2 系统仿真神经网络控制器结构及算法所用参数 |
47-49 |
|
5.3 实验结果数据 |
49-54 |
|
5.4 本章小结 |
54-55 |
|
第6章 结束语 |
55-57 |
|
参考文献 |
57-61 |
|
致谢 |
61-62 |
|
攻读硕士学位期间发表的学术论文目录 |
62-63 |
|
获奖情况 |
63-64 |
|
学位论文评阅及答辩情况表 |
64 |
|
| 【DOI】 | LunWen.ID:2.2008.388679 |