| 【中文题名】 | 基于分布式概念格的知识发现研究 |
| 【英文题名】 | Research on Knowledge Discovery in Databases Based on Distributed Concept Lattices |
| 【学科专业】 | 计算机应用技术 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2005-7-13 |
| 【中关键词】 | 概念格,知识发现,数据挖掘,分布式,分类, |
| 【英关键词】 | concept lattice,KDD,data mining,distributed,classification, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>自动化基础理论>人工智能理论>> |
| 【论文摘要】 | 知识发现和数据挖掘是人工智能、机器学习、数据库和统计理论等相交叉形成的新学科,目的是从数据库中提取有用的模式,因而具有广阔的应用价值。然而,随着信息技术日新月异的发展,人类生产生活的各个领域都积累了规模庞大的数据,从大规模的数据中高效地提取有用的模式已经成为了一种挑战。为此,并行和分布式的方法成为解决这一问题的一个有效途径受到重视。然而,组织数据的方式和并行处理的方法无论在理论上还是在技术上都有许多问题需要研究。概念格模型具有坚实的理论基础、完备的结构以及并行性的特征,因而成为解决上述问题的一个重要工具。本文针对分布式概念格的模型以及在此基础上的数据挖掘开展研究。
论文的主要工作和贡献如下:
1.概述了知识发现和数据挖掘研究和应用。
2.阐述了概念格的数学基础、传统的概念格研究及概念格的扩展模型和概念格构造,分析了批处理算法和渐进式算法的优缺点。
3.给出了一种新的分布式概念格的模型,提出了与传统分布式数据库中的横向、纵向、混合型分片方式不同的数据有机分割方式,在此基础上给出了便于并行实现的概念格构造算法SEA。该算法结合了批处理算法的并行性和渐进式算法的高效性... |
| 【论文题纲】 |
|
第一章 概述 |
12-22 |
|
§1.1 问题的提出 |
12-14 |
|
§1.1.1 数据库技术的发展 |
12-13 |
|
§1.1.2 网络技术的发展 |
13-14 |
|
§1.2 知识发现和数据挖掘 |
14-19 |
|
§1.2.1 基本概念 |
14-15 |
|
§1.2.2 KDD过程和任务 |
15 |
|
§1.2.3 数据挖掘系统的构成 |
15-17 |
|
§1.2.4 数据挖掘发展及所面临的问题 |
17-19 |
|
§1.2.4.1 数据挖掘发展 |
17-18 |
|
§1.2.4.2 数据挖掘所面临的挑战 |
18-19 |
|
§1.3 形式概念分析概述 |
19-21 |
|
§1.3.1 形式概念分析的起源 |
19-20 |
|
§1.3.2 形式概念分析主要内容 |
20 |
|
§1.3.3 国内外研究现状 |
20-21 |
|
§1.4 本文的组织 |
21-22 |
|
第二章 概念格模型的基础 |
22-32 |
|
§2.1 概念格数学模型 |
22-24 |
|
§2.1.1 序论与格论中的基本定义——代数格 |
22-23 |
|
§2.1.2 形式概念分析的理论基础——概念格 |
23-24 |
|
§2.2 概念格及其扩展模型的研究 |
24-30 |
|
§2.2.1 传统的概念格 |
24-25 |
|
§2.2.2 概念格扩展模型 |
25-30 |
|
§2.2.2.1 扩展概念格 |
26-27 |
|
§2.2.2.2 量化概念格 |
27-28 |
|
§2.2.2.3 广义概念格 |
28-29 |
|
§2.2.2.4 基于近似包含和近似等价关系的格结构 |
29-30 |
|
§2.3 概念格的建格算法 |
30-31 |
|
§2.4 本章小结 |
31-32 |
|
第三章 分布式概念格模型及基于子全概念的算法SEA |
32-45 |
|
§3.1 基本定义 |
32-33 |
|
§3.1.1 数学模型 |
32 |
|
§3.1.2 数据的有机分割 |
32-33 |
|
§3.2 基于子全概念的概念格构造算法SEA |
33-34 |
|
§3.2.1 算法概述 |
33-34 |
|
§3.2.2 SEA算法与其它概念格并行算法的比较 |
34 |
|
§3.3 数据的有机分割与子全概念的生成 |
34-38 |
|
§3.3.1 直接扩展节点的计算 |
34-36 |
|
§3.3.2 子全概念的生成 |
36-38 |
|
§3.4 渐进式算法的基本思想 |
38-39 |
|
§3.5 子格的合并 |
39-40 |
|
§3.6 示例说明 |
40-42 |
|
§3.7 实验结果及算法时空性能考虑 |
42-44 |
|
§3.8 本章小结 |
44-45 |
|
第四章 基于概念格的分类 |
45-60 |
|
§4.1 分类问题概述 |
45 |
|
§4.2 分类问题所用到的方法 |
45-51 |
|
§4.2.1 决策树分类 |
46-48 |
|
§4.2.2 贝叶斯分类 |
48-50 |
|
§4.2.3 神经网络 |
50 |
|
§4.2.4 基于概念格的分类 |
50 |
|
§4.2.5 其它分类方法 |
50-51 |
|
§4.3 基于概念格的分类系统ABCS |
51-57 |
|
§4.3.1 基本概念 |
51-52 |
|
§4.3.2 类特征的提取算法 |
52-54 |
|
§4.3.3 分类策略与分类器 |
54-55 |
|
§4.3.4 实例说明 |
55-57 |
|
§4.4 概念格和其他分类规则学习方法的比较 |
57-60 |
|
第五章 基于概念格的数据挖掘原型系统Condis的设计 |
60-65 |
|
§5.1 设计需求 |
60-61 |
|
§5.2 系统构成 |
61-62 |
|
§5.3 系统实现 |
62-65 |
|
第六章 结束语 |
65-66 |
|
参考文献 |
66-69 |
|
研究生期间发表论文 |
69 |
|
| 【DOI】 | LunWen.ID:2.2008.387382 |