| 【中文题名】 | 基于粗糙集和神经网络的不完备信息系统数据挖掘研究 |
| 【英文题名】 | Research to Data Mining of Incomplete Information System Based on Rough Set and Neural Network |
| 【学科专业】 | 基础数学 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2004-10-19 |
| 【中关键词】 | 不完备信息系统,数据挖掘,粗糙集,神经网络,, |
| 【英关键词】 | Incomplete Information System, Data Mining, Rough Set, Neural Network, |
| 【分类导航】 | 数理科学和化学>数学>代数、数论、组合理论>模糊数学>> |
| 【论文摘要】 | 在实际问题中,由于种种原因,数据库中的数据很少是完全的,在数据挖掘中,待处理的数据常有某种程度的不完备。不完备的信息系统普遍存在,如果直接对其使用针对完备信息系统的数据挖掘方法,往往是不合理的,甚至可能会严重影响到挖掘的效果。
造成信息不完备的原因是多样的,现实情况下,有些数据受客观条件限制无法观测到,或在数据录入过程受人为的因素影响导致数据缺失,或由于存储介质的故障、传输媒体的故障导致数据缺失,或数据被隐藏等等。粗糙集(Rough Set)理论是由波兰华沙理工大学Pawlak教授于20世纪80年代初提出的,是一种研究不完整、不确定知识和数据的表达、学习、归纳的理论方法。神经网络则有较强的学习能力,可根据一定的学习算法自动地从训练实例中学习并得到规则。
本研究将粗糙集理论与神经网络方法相结合,使两种方法优势互补。首先基于粗糙集理论对不完备系统进行完备化,然后对完备化后信息系统使用神经网络方法进行数据挖掘。
在完备化处理中,我们提出了改进的ROUSTIDA算法,该方法考虑到不完备信息系统中的遗失数据值的填补,应该尽可能反映此信息系统的基本特征以及隐含的内在规律,故以基于粗糙集... |
| 【论文题纲】 |
|
第1章 概述 |
6-8 |
|
第2章 粗糙集的基本概念 |
8-10 |
|
2.1 信息系统与决策表 |
8-9 |
|
2.2 近似空间 |
9-10 |
|
第3章 神经网络的基本概念 |
10-15 |
|
3.1 神经网络的基本概念 |
10-14 |
|
3.2 BP模型 |
14-15 |
|
第4章 粗糙集与神经网络结合的数据挖掘方法 |
15-37 |
|
4.1 数据预处理 |
15-17 |
|
4.1.1 基本概念 |
15-16 |
|
4.1.2 数据离散化和属性约简 |
16-17 |
|
4.2 用粗糙集方法进行缺失值的填充 |
17-21 |
|
4.2.1 可辨识矩阵 |
17-19 |
|
4.2.2 基于粗糙集理论的不完备数据分析方法(ROUSTIDA) |
19-21 |
|
4.3 ROUSTIDA的改进算法 |
21-27 |
|
4.3.1 有缺失属性的对象与任何对象都不相似时的填充 |
21-23 |
|
4.3.2 有缺失属性的对象与多个对象都相似时的填充 |
23-24 |
|
4.3.3 不一致信息的避免 |
24-26 |
|
4.3.4 改进算法与原算法的比较 |
26-27 |
|
4.4 一致性表征填充方法 |
27-32 |
|
4.4.1 一致性矩阵 |
27-28 |
|
4.4.2 一致性表征阵 |
28-29 |
|
4.4.3 一致性表征填充方法 |
29-32 |
|
4.5 构建BP网络进行数据挖掘 |
32-37 |
|
4.5.1 构建BP网络 |
32 |
|
4.4.2 实验及结果分析 |
32-37 |
|
第5章 结束语 |
37-38 |
|
参考文献 |
38-137 |
|
| 【DOI】 | LunWen.ID:2.2008.11901 |