| 【中文题名】 | 遗传算法在数据挖掘中的研究与应用 |
| 【英文题名】 | Research and Application on Data Mining Based on Genetic Algorithms |
| 【学科专业】 | 计算机应用技术 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2007-10-16 |
| 【中关键词】 | 分类,遗传算法,关联规则,数据挖掘,, |
| 【英关键词】 | Classification,genetic algorithm,association rule,Data mining, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>自动化基础理论>人工智能理论>> |
| 【论文摘要】 |
数据挖掘是随着信息技术不断发展而形成的一门新学科,是数据库领域出现的一个新兴的研究热点。
关联规则作为数据挖掘领域的一个重要研究分支,针对关联规则挖掘中经典算法-Aprior算法的局限性,在划分技术的基础上提出了一种基于遗传算法的关联规则挖掘模型。
分类是数据挖掘中最重要的方法之一,决策树作为发现分类模型的常用技术现已被广泛研究并取得了很大的进展。然而,在决策树的构造过程中采用贪心算法,造成了决策树容易过分拟合、规模过大、产生的规则长度过长等缺点。针对这些缺陷,提出了一种基于遗传算法与关联规则算法的混合分类挖掘方法。
研究工作围绕着遗传算法应用于数据挖掘研究展开,基本上分为四部分:
(1)对KDD(Knowledge Discovery in Database)技术进行了总体上的概述,包括KDD的含义、一般过程、主要方法和技术、研究的现状及存在的问题等,为在这一领域进行更为深入的研究打下初步基础。在此基础之上对发现分类模型的各种技术以及关联规则挖掘算法进行了较为全面的研究。
(2)对遗传算法的编码方法、适应度函数、遗传操作算子、参数的选择作了全面且深入的研究。... |
| 【论文题纲】 |
|
摘要 |
4-5 |
|
ABSTRACT |
5-6 |
|
目录 |
6-9 |
|
第一章 绪论 |
9-12 |
|
1.1 论文的研究背景及其意义 |
9-10 |
|
1.2 遗传挖掘研究现状 |
10 |
|
1.3 论文研究的内容及组织 |
10-12 |
|
第二章 数据挖掘的基本理论 |
12-18 |
|
2.1 数据挖掘的产生与发展 |
12-13 |
|
2.2 数据挖掘的概念、基本过程、基本方法 |
13-18 |
|
2.2.1 数据挖掘的概念 |
13 |
|
2.2.2 数据挖掘的基本过程 |
13-14 |
|
2.2.3 数据挖掘的基本方法 |
14 |
|
2.2.4 数据挖掘对象 |
14-18 |
|
第三章 遗传算法基本理论 |
18-26 |
|
3.1 引言 |
18 |
|
3.2 遗传算法的基本原理 |
18-20 |
|
3.2.1 遗传算法描述 |
18-19 |
|
3.2.2 遗传算法执行过程 |
19-20 |
|
3.3 GA理论研究的内容 |
20-22 |
|
3.3.1 GA编码方法 |
20-21 |
|
3.3.2 GA适应值函数 |
21 |
|
3.3.3 GA的3个算子 |
21 |
|
3.3.4 GA参数的选择 |
21-22 |
|
3.4 遗传算法的主要特点 |
22-23 |
|
3.5 遗传算法的应用 |
23-25 |
|
3.6 遗传算法的研究热点 |
25-26 |
|
第四章 基于遗传算法的关联规则挖掘研究 |
26-45 |
|
4.1 关联规则简述 |
26-29 |
|
4.1.1 关联规则定义 |
26-27 |
|
4.1.2 关联规则挖掘的基本模型 |
27-28 |
|
4.1.3 关联规则的研究现状 |
28-29 |
|
4.2 关联规则挖掘的经典算法-Apriori算法 |
29-32 |
|
4.2.1 Apriori算法概述 |
29 |
|
4.2.2 Apriori算法基本思想 |
29-30 |
|
4.2.3 Apriori算法描述 |
30-31 |
|
4.2.4 Apriori算法的几种改进形式 |
31-32 |
|
4.3 基于遗传算法的关联规则挖掘模型 |
32-45 |
|
4.3.1 改进的 Apriori算法 |
33 |
|
4.3.2 IAGADM模型流程 |
33-36 |
|
4.3.3 IAGADM模型设计 |
36-38 |
|
4.3.4 仿真试验 |
38-39 |
|
4.3.5 与 Apriori算法的性能比较 |
39-42 |
|
4.3.6 基于并行遗传算法的关联规则挖掘 |
42-45 |
|
第五章 基于遗传与关联规则算法的混合分类挖掘研究 |
45-60 |
|
5.1 引言 |
45 |
|
5.2 分类定义 |
45 |
|
5.3 分类规则 |
45-46 |
|
5.4 常用的分类算法 |
46-52 |
|
5.4.1 决策树分类 |
46-49 |
|
5.4.2 基于关联规则的分类算法 |
49-50 |
|
5.4.3 基于遗传算法的分类 |
50-51 |
|
5.4.4 概念格分类 |
51 |
|
5.4.5 其它分类问题 |
51-52 |
|
5.5 一种基于遗传与关联规则算法的混合分类规则挖掘算法 |
52-60 |
|
5.5.1 AGA算法流程 |
52-53 |
|
5.5.2 AGA模型中的遗传算法流程 |
53 |
|
5.5.3 AGA模型中遗传算法的设计与实现 |
53-56 |
|
5.5.4 分类规则约简 |
56-57 |
|
5.5.5 AGA应用实例分析 |
57-60 |
|
第六章 总结与展望 |
60-63 |
|
6.1 总结 |
60-61 |
|
6.2 存在问题 |
61-63 |
|
参考文献 |
63-67 |
|
致谢 |
67-68 |
|
攻读硕士学位期间发表的论文 |
68 |
|
| 【DOI】 | LunWen.ID:2.2008.389064 |