| 【中文题名】 | 基于RMI技术的分布式数据挖掘平台设计与研究 |
| 【英文题名】 | Research on Distributed Data Mining Platform Based on RMI |
| 【学科专业】 | 管理科学与工程 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2007-10-30 |
| 【中关键词】 | 分布式数据挖掘,数据挖掘平台,RMI技术,DFP算法,DID3算法, |
| 【英关键词】 | Distributed Data Mining,Data Mining Platform,RMI Technology,DFP,DID3, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>计算技术、计算机技术>计算机软件>程序设计、软件工程>程序设计 |
| 【论文摘要】 |
数据挖掘,也称为数据库中的知识发现,是从大量、不完全、模糊的实际应用数据中,提取隐含在其中、事先不知道的信息和知识的过程。传统的数据挖掘技术采用的挖掘算法:一方面所处理的数据都是集中在一台机器上,另一方面整个挖掘过程的计算也集中在一台机器上。随着各种网络尤其是Internet的广泛使用,网络中可获得的数据量持续增长,需要挖掘的数据源往往分布存储在网络的各个节点上。同时,随着信息技术应用的深入,挖掘算法执行的对象数据集越来越大,需要大量的计算资源,这必然要求执行挖掘算法的机器有相当高的性能,一台机器通常很难完成这种超大量的计算任务,与之相应的在其它分布式站点上的机器有着充裕的计算资源却不能有效地利用。对于这两个问题,传统的数据挖掘技术根本无法解决,因此分布式数据挖掘技术随之而出。
所谓分布式数据挖掘就是使用分布式计算资源,从分布式数据库中发现知识的过程,主要包括两方面的内容:一方面,跨多个网络节点对分布式数据集进行联合挖掘;另一方面,利用网络节点的计算资源进行协同挖掘,满足巨大的计算工作量需求。通过对Agent、网格、RMI、CORBA等分布式技术进行比较,可以发现,Agent、网格技术是两种... |
| 【论文题纲】 |
|
摘要 |
2-4 |
|
ABSTRACT |
4-8 |
|
第一章 引言 |
8-13 |
|
1.1 课题背景、研究现状及选题意义 |
8-10 |
|
1.2 研究内容和思路 |
10-11 |
|
1.3 论文的创新点 |
11 |
|
1.4 论文的组织结构 |
11-13 |
|
第二章 分布式计算技术 |
13-20 |
|
2.1 分布式计算技术原理 |
13 |
|
2.2 分布式计算技术比较 |
13-20 |
|
2.2.1 基于Agent技术的分布式计算 |
13-15 |
|
2.2.2 基于网格技术的分布式计算 |
15-17 |
|
2.2.3 基于RMI、CORBA等其它分布式技术的分布式计算 |
17-19 |
|
2.2.4 选择RMI技术 |
19-20 |
|
第三章 数据挖掘理论和分布式数据挖掘理论 |
20-26 |
|
3.1 数据挖掘理论 |
20-24 |
|
3.1.1 数据挖掘的过程 |
20-21 |
|
3.1.2 数据挖掘的相关算法 |
21-23 |
|
3.1.3 数据挖掘的应用现状 |
23-24 |
|
3.2 分布式数据挖掘理论 |
24-26 |
|
3.2.1 什么是分布式数据挖掘 |
24-25 |
|
3.2.2 分布式数据挖掘的一些算法 |
25-26 |
|
第四章 分布式关联规则数据挖掘的设计 |
26-41 |
|
4.1 关联规则挖掘简介 |
26-28 |
|
4.1.1 关联规则基本概念 |
26-27 |
|
4.1.2 关联规则挖掘步骤 |
27 |
|
4.1.3 关联规则的种类 |
27-28 |
|
4.2 传统FP-Tree算法 |
28-34 |
|
4.2.1 算法简介 |
28-30 |
|
4.2.2 算法实现 |
30-34 |
|
4.3 DFP算法 |
34-41 |
|
4.3.1 算法的总体架构 |
34-35 |
|
4.3.2 算法实现 |
35-39 |
|
4.3.3 分布式与传统数据挖掘的性能比较 |
39-41 |
|
第五章 分布式分类数据挖掘的设计 |
41-60 |
|
5.1 分类数据挖掘简介 |
41-42 |
|
5.2 决策树 |
42-43 |
|
5.3 传统ID3归纳算法 |
43-51 |
|
5.3.1 ID3算法简介 |
43-46 |
|
5.3.2 ID3算法实现 |
46-49 |
|
5.3.3 ID3性能分析 |
49-51 |
|
5.4 DID3算法 |
51-60 |
|
5.4.1 DID3算法的总体架构 |
51-52 |
|
5.4.2 DID3算法实现 |
52-56 |
|
5.4.3 DID3算法性能分析 |
56-58 |
|
5.4.4 DID3算法与ID3算法性能比较 |
58-60 |
|
第六章 系统平台的分析与设计 |
60-65 |
|
6.1 系统平台整个架构 |
60-61 |
|
6.2 系统平台原型 |
61-63 |
|
6.3 平台设计思路总结 |
63-65 |
|
第七章 总结与进一步工作 |
65-67 |
|
7.1 本文工作的总结 |
65 |
|
7.2 进一步工作 |
65-67 |
|
参考文献 |
67-71 |
|
致谢 |
71-72 |
|
攻读硕士期间发表的学术论文 |
72-73 |
|
| 【DOI】 | LunWen.ID:2.2008.362628 |