| 【中文题名】 | 基于遗传算法的分类规则挖掘研究 |
| 【英文题名】 | Research on Classification Rule Mining Based on Genetic Algorithms |
| 【学科专业】 | 计算机应用技术 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2007-8-21 |
| 【中关键词】 | 数据挖掘,遗传算法,分类规则,相似度,杂交优势, |
| 【英关键词】 | Data mining,Genetic algorithm,Classification rules,Similarity degree,Beneficial Crossover, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>计算技术、计算机技术>计算机软件>程序设计、软件工程>程序设计 |
| 【论文摘要】 |
数据挖掘是近年来兴起的一个新的研究领域,它综合了数据库技术、人工智能、统计学等多个学科,最终目的是从大量的数据资料中发现有价值的信息和知识,即蕴涵在数据中的信息,从而达到为决策支持的目的。分类规则挖掘则是通过对训练样本数据集的学习构造分类规则的过程,是数据挖掘、知识发现的一个重要方面,其实质是希望得到高准确性、易于理解的和有趣的分类规则。遗传算法是一种基于生物进化论和分子遗传学的全局随机搜索算法。
本文对基于遗传算法的分类规则挖掘进行了研究,并在此基础上,提出了基于相似度的交叉变异算子,改进了种间竞争遗传算法,并将它们应用到分类规则的挖掘中。
论文首先回顾了数据挖掘的历史背景,并对数据挖掘的基本概念、过程、特点、分类及任务模式进行了详细地归纳和总结,着重讨论了分类规则挖掘的步骤、技术和方法。此后,对遗传算法的生物由来、特点和理论基础进行了概述,总结了简单遗传算法的流程,三大算子和四大关键问题,并分析和讨论了简单遗传算法应用于分类规则挖掘中存在的“早熟”收敛现象发生的原因和一般的解决方法。接着,在简单遗传算法基础上,为了克服简单遗传算法“早熟”收敛的问题,引入“相似度”和“杂交优势”思... |
| 【论文题纲】 |
|
摘要 |
4-5 |
|
Abstract |
5-9 |
|
第1章 绪论 |
9-12 |
|
1.1 课题背景 |
9-10 |
|
1.2 本论文研究内容 |
10-11 |
|
1.3 本论文的章节安排 |
11-12 |
|
第2章 数据挖掘与分类规则挖掘概述 |
12-21 |
|
2.1 数据挖掘的产生和发展 |
12 |
|
2.2 数据挖掘的基本知识 |
12-17 |
|
2.2.1 数据挖掘的概念 |
12-13 |
|
2.2.2 数据挖掘的过程 |
13-14 |
|
2.2.3 数据挖掘的特点 |
14-15 |
|
2.2.4 数据挖掘的分类 |
15-16 |
|
2.2.5 数据挖掘的任务模式 |
16-17 |
|
2.3 分类数据挖掘 |
17-21 |
|
2.3.1 分类数据挖掘概述 |
17 |
|
2.3.2 分类数据挖掘步骤 |
17-19 |
|
2.3.3 分类数据挖掘的方法 |
19-21 |
|
第3章 遗传算法研究及问题分析 |
21-42 |
|
3.1 遗传算法概述 |
21-24 |
|
3.1.1 遗传算法的概念 |
21-22 |
|
3.1.2 遗传算法的特点 |
22-23 |
|
3.1.3 遗传算法的基本术语 |
23-24 |
|
3.2 遗传算法的理论基础 |
24-26 |
|
3.2.1 模式定理 |
24-25 |
|
3.2.2 积木块假设 |
25 |
|
3.2.3 隐含并行性 |
25 |
|
3.2.4 模式欺骗问题 |
25-26 |
|
3.3 简单遗传算法 |
26-36 |
|
3.3.1 算法流程及描述 |
26-28 |
|
3.3.2 三大遗传算子 |
28-32 |
|
3.3.3 四大关键问题 |
32-36 |
|
3.4 遗传算法应用于数据挖掘中的问题分析 |
36-42 |
|
3.4.1 存在问题 |
36-38 |
|
3.4.2 “早熟”现象的原因及解决 |
38-42 |
|
第4章 基于相似度交叉变异算子的提出及其应用 |
42-57 |
|
4.1 基于相似度的交叉变异算子 |
42-44 |
|
4.1.1 自适应变异算子 |
42-43 |
|
4.1.2 基于“杂交”优势的交叉算子 |
43-44 |
|
4.1.3 预选择算子 |
44 |
|
4.2 新算法流程及实现 |
44-48 |
|
4.2.1 算法流程 |
44-46 |
|
4.2.2 算法实现 |
46-48 |
|
4.3 新算子应用于分类规则挖掘 |
48-52 |
|
4.3.1 分类规则的编码 |
48 |
|
4.3.2 适应度函数 |
48-49 |
|
4.3.3 选择算子的改进 |
49-50 |
|
4.3.4 带新算子的分类规则挖掘算法流程及代码描述 |
50-52 |
|
4.4 测试和实验 |
52-55 |
|
4.4.1 测试环境和数据 |
52-53 |
|
4.4.2 算法参数的设置 |
53 |
|
4.4.3 实验结果分析和比较 |
53-55 |
|
4.5 小结 |
55-57 |
|
第5章 种间竞争遗传算法的改进及应用 |
57-68 |
|
5.1 种间竞争遗传算法 |
57-58 |
|
5.1.1 算法概述 |
57 |
|
5.1.2 算法描述 |
57-58 |
|
5.2 种间竞争遗传算法的改进 |
58-62 |
|
5.2.1 改进思想 |
58-59 |
|
5.2.2 改进算法描述 |
59-62 |
|
5.3 改进算法在分类规则挖掘中的应用 |
62-63 |
|
5.3.1 分类规则挖掘的准备工作 |
62-63 |
|
5.3.2 改进算法的分类规则挖掘流程 |
63 |
|
5.4 测试和实验 |
63-66 |
|
5.4.1 测试环境与数据 |
63-65 |
|
5.4.2 算法参数的设置 |
65 |
|
5.4.3 实验结果的分析和比较 |
65-66 |
|
5.5 小结 |
66-68 |
|
结论与展望 |
68-70 |
|
致谢 |
70-71 |
|
参考文献 |
71-75 |
|
攻读硕士学位期间发表的论文 |
75 |
|
| 【DOI】 | LunWen.ID:2.2008.388812 |