| 【中文题名】 | 关联规则挖掘及其在遥感数据处理中的应用研究 |
| 【英文题名】 | The Research of Mining Association Rules and It's Application on Remote Sense Image |
| 【学科专业】 | 计算机软件与理论 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2007-8-3 |
| 【中关键词】 | 数据挖掘,关联规则,模糊集,遥感数据,, |
| 【英关键词】 | Data Mining,Association Rules,Remote sense image,fuzzy-set, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>遥感技术>遥感图像的解译、识别与处理>> |
| 【论文摘要】 |
随着计算机技术的普及,商业、政府、企业中积存了大量的原始数据,迫切需要一种有效的从大规模数据库中发现有价值信息的工具和方法。数据挖掘,也称数据库知识发现,是从数据库中发现并提取新颖的、有效的、并能为人们理解的高级处理过程。
关联规则挖掘是数据挖掘中的一个重要问题,关联规则挖掘目的在于发现大量数据中项集之间有趣的关联或相关联系,从而生成关联规则。利用这些规则可以有助于发现交易数据库中不同商品(项)之间的联系等。本文的主要工作如下:
首先,对经典关联规则算法进行了分析并做出了改进。针对Apriori算法需要多次重复扫描数据库的缺点,利用非频繁项目集的超集是非频繁项目集这一性质,提出一种通过判断K维项目集的K-1维子集的个数来减少数据库扫描次数的方法。在FP-growth算法的基础上提出一种投影算法。当数据库很大时在构造FP-tree的过程中,由于将事务中的频繁项插入到FP-tree的过程是一个严格串行计算的过程,可能会造成性能上瓶颈。本文提出一种通过建立一个小数据库来存储临时节点的并行策略快速构造频繁模式树,提高了算法的效率,减少了不必要的开销。
其次,在对数据预处理方法研究的基... |
| 【论文题纲】 |
|
摘要 |
5-6 |
|
Abstract |
6-7 |
|
致谢 |
7-12 |
|
第一章 绪论 |
12-20 |
|
1.1 KDD和数据挖掘 |
12-13 |
|
1.1.1 理解KDD |
12-13 |
|
1.1.2 KDD的处理过程 |
13 |
|
1.2 数据挖掘 |
13-15 |
|
1.2.1 数据挖掘任务 |
13-14 |
|
1.2.2 数据挖掘的技术 |
14-15 |
|
1.2.3 数据挖掘面临的挑战 |
15 |
|
1.3 国内外研究现状 |
15-17 |
|
1.3.1 国内外研究现状 |
15-16 |
|
1.3.2 数据挖掘典型的应用领域 |
16-17 |
|
1.4 我国遥感数据处理的地位以及作用 |
17-19 |
|
1.4.1 对目前存在问题的分析 |
17-18 |
|
1.4.2 将关联规则应用于遥感数据处理 |
18-19 |
|
1.5 本文主要研究的内容以及结构安排 |
19-20 |
|
第二章 数据挖掘的相关技术 |
20-26 |
|
2.1 KDD的一般步骤和体系结构 |
20-21 |
|
2.1.1 KDD的一般步骤 |
20 |
|
2.1.2 数据挖掘系统的体系结构 |
20-21 |
|
2.2 模糊集理论 |
21-23 |
|
2.2.1 模糊集合定义 |
22 |
|
2.2.2 模糊集合的性质 |
22 |
|
2.2.3 模糊集的应用 |
22-23 |
|
2.3 聚类理论 |
23-25 |
|
2.3.1 聚类定义 |
24 |
|
2.3.2 基于划分的聚类方法 |
24 |
|
2.3.3 基于层次的聚类方法 |
24-25 |
|
2.3.4 基于密度的方法 |
25 |
|
2.3.5 基于网格的方法 |
25 |
|
2.3.5 基于模型的方法 |
25 |
|
2.4 本章小结 |
25-26 |
|
第三章 关联规则算法研究 |
26-40 |
|
3.1 关联规则基本概念 |
26-28 |
|
3.1.1 关联规则的度量方法 |
26-27 |
|
3.1.2 关联规则一般步骤 |
27 |
|
3.1.2 关联规则挖掘的主要研究方向和典型算法 |
27-28 |
|
3.2 Apriori算法 |
28-32 |
|
3.2.1 Apriori算法 |
28-29 |
|
3.2.2 Apriori算法的描述 |
29-30 |
|
3.2.3 Apriori算法的改进 |
30-31 |
|
3.2.4 算法性能测试 |
31-32 |
|
3.3 FP-growth算法 |
32-37 |
|
3.3.1 传统的FP-growth算法 |
32-33 |
|
3.3.2 FP-growth算法描述 |
33-34 |
|
3.3.3 FP-growth算法的改进 |
34-36 |
|
3.3.4 算法性能测试 |
36-37 |
|
3.4 基于模糊集和聚类的数量离散化算法 |
37-39 |
|
3.4.1 算法的提出 |
37-38 |
|
3.4.2 算法的描述 |
38-39 |
|
3.5 本章小结 |
39-40 |
|
第四章 遥感数据中关联规则的挖掘 |
40-48 |
|
4.1 遥感数据的特点与数据挖掘方法 |
40-41 |
|
4.1.1 遥感数据的特点 |
40 |
|
4.1.2 遥感数据的数据挖掘方法 |
40-41 |
|
4.2 遥感数据的处理过程 |
41-44 |
|
4.2.1 遥感数据库挖掘的步骤 |
41-42 |
|
4.2.2 遥感数据挖掘平台的系统设计 |
42-44 |
|
4.3 关联规则在遥感数据挖掘中的应用 |
44-48 |
|
4.3.1 数据预处理 |
44-46 |
|
4.3.2 对处理过后的数据进行关联规则挖掘 |
46-48 |
|
第五章 总结和展望 |
48-50 |
|
5.1 本文总结 |
48 |
|
5.2 下一步工作 |
48-50 |
|
参考文献 |
50-53 |
|
研究生期间发表的论文 |
53 |
|
| 【DOI】 | LunWen.ID:2.2008.389464 |