| 【中文题名】 | 知识发现理论与方法及其应用的研究 |
| 【英文题名】 | |
| 【学科专业】 | 信号与信息处理 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2004-7-7 |
| 【中关键词】 | 知识发现,数据挖掘,粗糙集,模糊集,神经网络,小波包 |
| 【英关键词】 | Knowledge discovery in database (KDD),Data Mining,Rough set,fuzzy set,neural network,wavelet packet, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>自动化基础理论>人工智能理论>专家系统、知识工程> |
| 【论文摘要】 | 自二十世纪90年代开始,得益于全世界所拥有的巨大数据资源以及将这些数据资源转换为信息和知识资源的巨大需求,知识发现作为一个从大规模数据库中发现有用知识的过程,逐步发展成为一门具有广泛应用的新兴学科。但是目前知识发现的理论体系尚不完善,还没有形成一门独立完整的学科,而且知识发现的一般原理与针对特定应用领域的有效知识发现工具之间还存在着不小的差距。在这种情况下,本文系统地研究了知识发现已有的理论和概念,阐述了知识发现的整个过程模型,在分析已有的几种知识发现算法基础上,提出了两种知识发现新算法。
首先,介绍了知识发现的基本概念和技术。在论述知识发现处理过程模型的同时,介绍了知识发现的功能及其应用。
其次,简要讨论了粗糙集、神经网络和模糊集理论。介绍了已有的几种知识发现方法,如基于粗糙集理论的BP网络,模糊C-均值算法和最大化分类指标算法,并对这些算法进行了计算机模拟实验。本文提出了一种基于模糊集理论和信息增益分析技术的分类算法,并且由计算机实验证明此算法具有计算量小、无需事先确定分类属性个数且可得到较高分类正确率的优点。本文还提出了一种基于小波包的空间数据库聚类算法,它能有效地处理大型空间数... |
| 【论文题纲】 |
|
1 绪论 |
7-16 |
|
1.1 知识发现的应用价值及选题意义 |
7 |
|
1.2 知识发现基本思想 |
7-13 |
|
1.2.1 知识发现定义 |
8-9 |
|
1.2.2 知识发现的起源 |
9 |
|
1.2.3 知识发现的功能 |
9-11 |
|
1.2.4 知识发现系统的分类 |
11-13 |
|
1.2.5 知识发现应用 |
13 |
|
1.3 知识发现研究概况及面临问题 |
13-14 |
|
1.4 论文的主要研究内容和结构安排 |
14-16 |
|
2 知识发现的基本原理 |
16-35 |
|
2.1 知识发现的概念 |
16-21 |
|
2.1.1 处理过程模型介绍 |
16-18 |
|
2.1.2 数据仓库技术 |
18-19 |
|
2.1.3 知识发现与相关学科的区别与联系 |
19-21 |
|
2.2 数据预处理 |
21-23 |
|
2.2.1 数据预处理的重要性 |
21 |
|
2.2.2 数据预处理方法 |
21-23 |
|
2.3 知识发现的功能 |
23-33 |
|
2.3.1 概念描述:特征化与比较 |
23-26 |
|
2.3.2 关联规则分析 |
26-29 |
|
2.3.3 分类和预测 |
29-31 |
|
2.3.4 聚类分析 |
31-32 |
|
2.3.5 孤立点分析 |
32-33 |
|
2.3.6 演变分析 |
33 |
|
2.3.7 复杂类型数据的挖掘 |
33 |
|
2.4 知识发现的应用和发展趋势 |
33-34 |
|
2.5 小结 |
34-35 |
|
3 基于粗糙集理论和神经网络的知识发现算法 |
35-47 |
|
3.1 粗糙集理论的基础知识 |
35-37 |
|
3.1.1 粗糙集理论的基本概念 |
35-36 |
|
3.1.2 应用举例 |
36-37 |
|
3.2 神经网络的基本概念 |
37-40 |
|
3.3 基于粗糙集理论的BP网络设计 |
40-46 |
|
3.3.1 网络结构及算法步骤 |
41-43 |
|
3.3.2 实验结果分析 |
43-46 |
|
3.4 小结 |
46-47 |
|
4 基于模糊集理论的知识发现算法 |
47-60 |
|
4.1 模糊集理论的基本概念 |
47-50 |
|
4.1.1 模糊集理论的基础知识 |
47-49 |
|
4.1.2 模糊化方法 |
49 |
|
4.1.3 模糊程度的度量 |
49-50 |
|
4.2 模糊C-均值聚类算法 |
50-53 |
|
4.2.1 模糊C-均值算法(FCM fuzzy C-means) |
50-51 |
|
4.2.2 最大化分类指标算法(PIM partition index maximization) |
51-53 |
|
4.3 基于模糊集理论和信息增益分析技术的分类算法 |
53-59 |
|
4.3.1 模糊关联规则分类 |
54-55 |
|
4.3.2 信息增益分析技术 |
55-56 |
|
4.3.3 基于信息增益分析技术的模糊分类算法 |
56-58 |
|
4.3.4 实验模拟 |
58-59 |
|
4.4 小结 |
59-60 |
|
5 基于小波包分析的知识发现算法 |
60-68 |
|
5.1 小波包分析基础 |
60-62 |
|
5.1.1 小波包数学模型 |
60-62 |
|
5.1.2 小波包算法 |
62 |
|
5.2 基于小波包的聚类算法 |
62-66 |
|
5.2.1 基于小波包的聚类步骤及分析说明 |
62-63 |
|
5.2.2 算法特性分析 |
63-64 |
|
5.2.3 实验数据分析 |
64-66 |
|
5.3 知识发现的其他方法 |
66-67 |
|
5.4 小结 |
67-68 |
|
6 总结和展望 |
68-70 |
|
参考文献 |
70-73 |
|
攻读硕士学位期间的研究成果 |
73-74 |
|
致谢 |
74-76 |
|
| 【DOI】 | LunWen.ID:2.2008.387050 |