| 【中文题名】 | 不确定SMDP基于性能势的鲁棒控制研究 |
| 【英文题名】 | Robust Control for Uncertain Semi-Markov Decision Processes Based on Performance Potentials |
| 【学科专业】 | 计算机应用技术 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2007-8-3 |
| 【中关键词】 | 半Markov决策过程,性能势,鲁棒控制,策略迭代,遗传算法, |
| 【英关键词】 | Semi-Markov decision process,Robust control,Performance potential,Policy iteration,Genetic algorithm, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>自动化基础理论>自动控制理论>> |
| 【论文摘要】 |
半Markov决策过程(SMDP)是离散事件动态系统用于描述随机序贯决策问题的一类基本模型,其性能的分析和优化对许多现实系统具有重要的指导意义。在SMDP模型中,状态的转移概率和性能函数是影响系统性能的两个重要因素。然而实际应用中,由于建模上的困难和外界环境的干扰,系统的状态转移概率往往难以精确得知,系统的即时性能也可能因某些不确定参数的影响而产生波动。为适应这类不确定SMDP系统在最优控制上的需要,本文在性能势理论的基础上研究了一类受不确定参数影响的SMDP鲁棒控制问题,着重讨论参数极坏情况下使系统性能达到最优的鲁棒控制策略求解算法。
根据嵌入链结构的不同,SMDP可划分为遍历链、单链和多链三种模型。本文从最简单的遍历链模型出发,首先给出不相关不确定参数下的求解最优鲁棒策略的策略迭代算法,并讨论了策略迭代的收敛性;对参数相关的情况,本文详细介绍了遗传算法在SMDP鲁棒控制过程中的应用。在一般的多链模型中,由于多个常返类和瞬态的存在,要求解其最优策略是相当困难的。通过一些假设性条件的限制,本文研究了平均准则下一类特殊多链SMDP的最优性方程,并给出了相应的策略迭代算法。考虑到系统状态数目的增... |
| 【论文题纲】 |
|
摘要 |
5-6 |
|
ABSTRACT |
6-7 |
|
致谢 |
7-10 |
|
插图清单 |
10-11 |
|
表格清单 |
11-12 |
|
第一章 绪论 |
12-18 |
|
1.1 SMDP简介 |
12-13 |
|
1.2 Markov决策理论的发展历史及研究现状 |
13-15 |
|
1.3 SMDP的鲁棒控制问题 |
15-16 |
|
1.4 本文内容和结构安排 |
16-18 |
|
第二章 半Markov决策过程及其优化理论 |
18-28 |
|
2.1 半Markov决策过程 |
18-23 |
|
2.1.1 SMDP的数学模型 |
18-19 |
|
2.1.2 SMDP的等价无穷小生成子和等价Markov过程 |
19-22 |
|
2.1.3 SMDP的α-一致化Markov链 |
22-23 |
|
2.2 SMDP的性能势及最优性方程 |
23-26 |
|
2.2.1 SMDP的性能势 |
23-24 |
|
2.2.2 基于性能势的最优性方程和最优性定理 |
24-26 |
|
2.3 不确定SMDP的数学模型及鲁棒控制目标 |
26-28 |
|
第三章 遍历链SMDP的鲁棒控制求解 |
28-42 |
|
3.1 参数不相关的鲁棒控制求解 |
28-35 |
|
3.1.1 策略迭代算法(PI) |
29 |
|
3.1.2 基于PI的鲁棒决策算法及其收敛性分析 |
29-33 |
|
3.1.2 数值例子及实验结果 |
33-35 |
|
3.2 参数相关的鲁棒控制求解 |
35-41 |
|
3.2.1 遗传算法(GA) |
36-38 |
|
3.2.2 基于GA的鲁棒决策算法 |
38-39 |
|
3.2.3 数值例子及实验结果 |
39-41 |
|
3.3 本章小结 |
41-42 |
|
第四章 多链SMDP的鲁棒控制求解 |
42-57 |
|
4.1 多链SMDP的数学模型 |
42-45 |
|
4.2 多链SMDP的性能势和最优性方程 |
45-47 |
|
4.3 参数不相关的鲁棒控制求解 |
47-50 |
|
4.3.1 多链结构下的策略迭代算法 |
47-49 |
|
4.3.2 数值例子及实验结果 |
49-50 |
|
4.4 参数相关的鲁棒控制求解 |
50-56 |
|
4.4.1 并行遗传算法(PGA) |
51-52 |
|
4.4.2 基于PGA的鲁棒决策算法 |
52-53 |
|
4.4.3 数值例子及实验结果 |
53-56 |
|
4.5 本章小结 |
56-57 |
|
第五章 总结与展望 |
57-59 |
|
参考文献 |
59-64 |
|
攻读硕士学位期间发表的论文 |
64 |
|
| 【DOI】 | LunWen.ID:2.2008.388774 |