| 【中文题名】 | 基于遗传规划的多类分类技术研究 |
| 【英文题名】 | The Research on Genetic Programming Techniques for Multi-classification |
| 【学科专业】 | 计算机应用技术 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2007-11-8 |
| 【中关键词】 | 遗传规划,GP,多类分类,梯度下降法,动态选择边界, |
| 【英关键词】 | Genetic Programming,GP,Multi-classification,Gradient-decent,Dynamic Range Selection, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>自动化基础理论>人工智能理论>> |
| 【论文摘要】 |
分类问题尤其是多类分类问题一直是数据挖掘研究的热点问题。在实际应用中,如图像识别,文本分类等等,需要处理的数据都是海量和多类别的。如何解决多类别的分类问题,是近几年研究的重点之一。本文将新的遗传学习算法——遗传规划(Genetic Programming)用于多类分类问题中,对其算法进行了尝试性地改进。
遗传规划是一种新型的搜索寻优方法。它仿效生物界中进化和遗传的过程,遵从“优胜劣汰,适者生存”原则,从一组随机生成的初始可行解开始,通过复制、交叉和变异等遗传操作,逐步迭代而逼近问题的最优解。本文阐述了遗传规划算法的原理和进化计算的基本知识;介绍了相关分类技术;分析了遗传规划的特点;研究了运用遗传规划解决分类问题的方法模型;并针对遗传规划在多类分类问题中的技术局限进行了改进。
本文主要从三个方面对基于遗传规划的多类分类技术进行改进。首先在基于静态选择边界模型(Static Range Selection,SRS)的基础上进行改进,建立了两种动态分类模型:基于中心的动态边界选择和基于狭槽的动态边界选择,对这两种模型进行了相应的算法设计。第二,将梯度下降搜索算法引入到遗传规划中。遗传规划整... |
| 【论文题纲】 |
|
摘要 |
4-5 |
|
Abstract |
5-9 |
|
1 绪论 |
9-12 |
|
1.1 研究背景 |
9 |
|
1.2 研究现状 |
9-10 |
|
1.3 本文研究思路 |
10-11 |
|
1.4 论文内容安排 |
11-12 |
|
2 遗传规划的基本理论 |
12-22 |
|
2.1 进化计算 |
12-13 |
|
2.1.1 遗传算法 |
12-13 |
|
2.1.2 进化规划 |
13 |
|
2.1.3 进化策略 |
13 |
|
2.2 遗传规划 |
13-22 |
|
2.2.1 遗传规划基本原理 |
13-16 |
|
2.2.2 遗传规划的特点 |
16 |
|
2.2.3 遗传规划的结构 |
16 |
|
2.2.4 个体的描述方法 |
16-17 |
|
2.2.5 初始群体的生成 |
17-18 |
|
2.2.6 遗传规划的适应度评价方法 |
18-20 |
|
2.2.7 遗传算子及遗传操作 |
20-21 |
|
2.2.8 终止准则与结果判定 |
21-22 |
|
3 分类技术研究 |
22-27 |
|
3.1 分类技术 |
22 |
|
3.2 分类方法 |
22-24 |
|
3.2.1 KNN方法 |
22-23 |
|
3.2.2 决策树分类法 |
23 |
|
3.2.3 人工神经网络分类 |
23 |
|
3.2.4 支持向量机分类法 |
23-24 |
|
3.3 基于遗传规划的分类技术 |
24-27 |
|
3.3.1 基于遗传规划的两类分类过程 |
24-25 |
|
3.3.2 基于遗传规划的多类分类技术 |
25 |
|
3.3.3 基于静态边界的遗传规划分类模型 |
25-27 |
|
4 基于遗传规划的多类分类技术改进 |
27-42 |
|
4.1 基于动态边界的分类模型 |
27-31 |
|
4.1.1 基于中心的动态边界选择模型 |
27-29 |
|
4.1.2 基于狭槽的动态边界选择模型 |
29-31 |
|
4.2 梯度下降法在遗传规划中的使用 |
31-38 |
|
4.2.1 梯度下降法的基本思路 |
32 |
|
4.2.2 遗传规划中的梯度下降算法 |
32-38 |
|
4.3 冗余代码的简化 |
38-42 |
|
4.3.1 遗传规划算法的搜索空间及存在的问题 |
38-39 |
|
4.3.2 消除冗余的方法 |
39-40 |
|
4.3.3 简化过程 |
40-42 |
|
5 基于遗传规划的多类分类技术实验 |
42-53 |
|
5.1 数据样本 |
42-44 |
|
5.1.1 计算机产生的基元图像 |
42-43 |
|
5.1.2 新西兰硬币 |
43-44 |
|
5.2 实验的建立 |
44-46 |
|
5.2.1 图像识别的过程 |
44 |
|
5.2.2 终端集的确定 |
44-45 |
|
5.2.3 函数集的确定和初始群体的生成 |
45-46 |
|
5.2.4 适应度函数 |
46 |
|
5.2.5 其它参数的设定 |
46 |
|
5.3 动态边界选择的分类模型实验结果与分析 |
46-48 |
|
5.3.1 计算机生成图形的实验结果与分析 |
47 |
|
5.3.2 新西兰硬币样本的实验结果与分析 |
47-48 |
|
5.4 遗传规划中引入梯度下降算法的实验结果与讨论 |
48-51 |
|
5.5 冗余简化的实验结果与分析 |
51-52 |
|
5.6 本章小结 |
52-53 |
|
6 结论与展望 |
53-55 |
|
6.1 本文的主要工作 |
53 |
|
6.2 对未来工作的展望 |
53-55 |
|
参考文献 |
55-61 |
|
在读期间发表的学术论文 |
61-62 |
|
作者简历 |
62-63 |
|
致谢 |
63-64 |
|
附录 |
64-68 |
|
| 【DOI】 | LunWen.ID:2.2008.389148 |