| 【中文题名】 | 基于关联规则的离群挖掘的研究 |
| 【英文题名】 | Research on Outlier Mining Based on Association Rules |
| 【学科专业】 | 计算机软件与理论 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2007-11-14 |
| 【中关键词】 | 关联规则挖掘,频繁项集,兴趣度,离群数据,离群数据挖掘, |
| 【英关键词】 | association rules mining,frequent itemset,interest,outlier,outlier mining, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>计算技术、计算机技术>计算机软件>程序设计、软件工程>程序设计 |
| 【论文摘要】 |
数据采集和存储技术的进步使得人们拥有数据的能力急剧提高,并且已有数据还在不断呈指数级的速度增长。隐藏在这些数据之后的更重要的信息是关于这些数据的整体特征的描述以及对其将来发展趋势的预测,这些信息在决策制定的过程中具有极其重要的参考价值。数据挖掘技术是对数据进行微观、中观乃至宏观的统计、分析、综合和推理,以指导实际问题的求解;发现事件间的相互关联,甚至利用已有的数据对未来的活动进行预测。
离群数据挖掘是数据挖掘的一个新兴课题,在实际生活中有着广泛的应用。对离群数据的发现分析,往往可以使人们发现一些真实的、但又出乎意料的知识。目前,离群数据挖掘正逐渐成为数据库、机器学习、统计学等领域研究人员的研究热点。
关联挖掘作为数据挖掘的一个重要研究分支,其主要研究目的就是从大型数据集中发现隐藏的、有趣的、属性间的规律,即关联规则。由于形式简单、易于理解,且是从大型数据库中提取知识的主要手段,因此,关联规则挖掘的研究和应用已经得到了数据库、人工智能及统计学等领域里学者的极大关注,并取得了不少的研究成果。
传统的关联挖掘算法大多是基于Apriori算法,该类算法在挖掘密集数据库时遇到了很大的困... |
| 【论文题纲】 |
|
摘要 |
3-5 |
|
Abstract |
5-9 |
|
第一章 绪论 |
9-16 |
|
1.1 背景 |
9-11 |
|
1.1.1 数据挖掘技术 |
9-10 |
|
1.1.2 企业管理应用的需求 |
10-11 |
|
1.2 关联规则挖掘的研究现状 |
11-12 |
|
1.3 离群数据挖掘的研究现状 |
12-13 |
|
1.4 课题研究的意义和目的 |
13-14 |
|
1.4.1 课题意义 |
13 |
|
1.4.2 研究目的 |
13-14 |
|
1.4.3 研究思路及方法 |
14 |
|
1.5 本文的内容和安排 |
14-16 |
|
1.5.1 本文的主要内容 |
14-15 |
|
1.5.2 本文的基本框架 |
15-16 |
|
第二章 关联规则挖掘的基本研究 |
16-30 |
|
2.1 关联规则的基本概念 |
16-18 |
|
2.2 关联规则的挖掘过程 |
18-19 |
|
2.3 关联规则挖掘的分类 |
19-22 |
|
2.3.1 关联规则的分类 |
19-20 |
|
2.3.2 多层关联规则挖掘 |
20-21 |
|
2.3.3 多维关联规则挖掘 |
21-22 |
|
2.4 关联规则的挖掘算法 |
22-28 |
|
2.4.1 关联规则挖掘经典算法-Apriori算法 |
22-24 |
|
2.4.2 一种基于Apriori算法的改进算法 |
24-28 |
|
2.4 本章小结 |
28-30 |
|
第三章 离群数据挖掘的基本研究 |
30-36 |
|
3.1 基本概念 |
30-31 |
|
3.1.1 离群数据的定义 |
30 |
|
3.1.2 离群数据挖掘的定义 |
30-31 |
|
3.2 离群数据挖掘的主要方法 |
31-34 |
|
3.2.1 基于分布的离群数据挖掘 |
31-32 |
|
3.2.2 基于距离的离群数据挖掘 |
32-33 |
|
3.2.3 基于偏离的离群数据挖掘 |
33 |
|
3.2.4 基于密度的离群数据挖掘 |
33-34 |
|
3.3 本章小结 |
34-36 |
|
第四章 基于关联规则的离群数据挖掘 |
36-48 |
|
4.1 研究背景 |
36 |
|
4.2 离群数据挖掘过程 |
36-37 |
|
4.3 基于规则的交易数据的离群挖掘算法 |
37-42 |
|
4.3.1 预备知识 |
37-39 |
|
4.3.2 算法描述 |
39-41 |
|
4.3.3 算法复杂度分析 |
41-42 |
|
4.4 实验1与结果分析 |
42-43 |
|
4.4.1 食品交易数据库数据介绍 |
42 |
|
4.4.2 实验结果分析 |
42-43 |
|
4.5 实验2与结果分析 |
43-46 |
|
4.5.1 求职数据库预处理 |
43-44 |
|
4.4.2 实验结果分析 |
44-46 |
|
4.6 本章小结 |
46-48 |
|
第五章 基于关联规则的离群挖掘系统框架 |
48-57 |
|
5.1 离群数据挖掘系统的概述 |
48-49 |
|
5.1.1 数据挖掘系统 |
48 |
|
5.1.2 离群数据挖掘系统 |
48 |
|
5.1.3 数据挖掘系统和离群数据挖掘系统的比较 |
48-49 |
|
5.2 离群数据挖掘系统的体系结构 |
49-52 |
|
5.2.1 系统设计要求 |
49-50 |
|
5.2.2 系统功能描述 |
50-51 |
|
5.2.3 系统体系结构 |
51-52 |
|
5.3 离群数据挖掘系统的关键技术 |
52-55 |
|
5.3.1 数据预处理技术 |
52 |
|
5.3.2 离群数据挖掘技术 |
52-54 |
|
5.3.3 规则分析技术 |
54-55 |
|
5.4 本章小结 |
55-57 |
|
第六章 结论与展望 |
57-59 |
|
6.1 本文工作总结 |
57-58 |
|
6.2 进一步研究的工作 |
58-59 |
|
参考文献 |
59-63 |
|
致谢 |
63-64 |
|
攻读硕士学位期间的主要科研工作 |
64 |
|
| 【DOI】 | LunWen.ID:2.2008.362656 |