| 【中文题名】 | 基于粗糙集的数据约简技术及应用研究 |
| 【英文题名】 | |
| 【学科专业】 | 计算机应用技术 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2006-12-6 |
| 【中关键词】 | 粗糙集,差别矩阵,决策表,启发式算法,属性约简, |
| 【英关键词】 | Rough set,Discernibility Matrix,Decision Table,Heuristic Algorithm,Attribute Reduction, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>计算技术、计算机技术>计算机的应用>信息处理(信息加工)>文字信息处理 |
| 【论文摘要】 | 智能信息处理是当前信息科学研究中的一个热点问题。随着信息时代的到来,信息量不断增长,信息模式越来越复杂,因此对信息分析工具的要求也越来越高。针对以上这些问题,波兰华沙理工大学的Pawlak教授在20世纪80年代提出了粗糙集(Rough set)理论,主要用来研究不完整、不确定知识和数据的表达、学习、归纳。目前该理论已得到了国际众多学者的重视。
本文着重对粗糙集的核心问题之一——决策表的约简进行了研究。决策表的约简包括决策表属性的约简和属性值的约简两部分。具体研究内容如下:
首先主要研究了属性约简中基于差别矩阵的约简算法和遗传算法,通过实例应用,对它们的性能进行了分析;另外研究了属性的值约简算法,并通过实例应用对以核值为基础的值约简算法和一种启发式值约简算法做了比较。
然后深入研究了四种属性约简的启发式算法,MIBARK算法,CEBARKCC算法,CEBARKNC算法和属性频度算法。通过实例应用,对三种基于信息量的MIBARK,CEBARKCC和CEBARKNC约简算法在算法的起点、终止条件、时间复杂度等几个不同的方面进行了分析;另外还对属性频度算法进行了改进,并... |
| 【论文题纲】 |
|
摘要 |
3-4 |
|
ABSTRACT |
4-7 |
|
第一章 绪论 |
7-12 |
|
1.1 概述 |
7-8 |
|
1.2 粗糙集的发展概况 |
8-10 |
|
1.2.1 粗糙集理论提出的背景 |
8 |
|
1.2.2 粗糙集的发展历程 |
8-9 |
|
1.2.3 粗糙集的研究对象 |
9 |
|
1.2.4 粗糙集的应用现状 |
9-10 |
|
1.3 本文的主要工作 |
10-11 |
|
1.4 本文的结构 |
11-12 |
|
第二章 粗糙集基础理论 |
12-19 |
|
2.1 引言 |
12 |
|
2.2 知识与知识库 |
12-13 |
|
2.3 粗糙集基本概念 |
13-15 |
|
2.3.1 不精确范畴、近似与粗集 |
13-14 |
|
2.3.2 粗糙集的数字特征和拓扑特征 |
14-15 |
|
2.4 知识的约简和依赖性 |
15-17 |
|
2.4.1 知识的约简和核 |
15-16 |
|
2.4.2 知识的相对约简和相对核 |
16 |
|
2.4.3 知识的依赖性 |
16-17 |
|
2.5 知识表达系统和决策表 |
17-18 |
|
2.5.1 知识表达系统 |
17-18 |
|
2.5.2 决策表 |
18 |
|
2.6 本章小结 |
18-19 |
|
第三章 决策表的约简 |
19-35 |
|
3.1 决策表的最小化 |
19 |
|
3.2 属性约简算法的研究与分析 |
19-27 |
|
3.2.1 属性约简概述 |
19-20 |
|
3.2.2 基于差别矩阵的属性约简算法 |
20-25 |
|
3.2.2.1 基于差别矩阵的属性约简算法 |
20-21 |
|
3.2.2.2 基于差别矩阵属性约简算法的简化 |
21-22 |
|
3.2.2.3 两种算法的应用与分析 |
22-25 |
|
3.2.3 基于遗传算法的属性约简 |
25-27 |
|
3.2.3.1 遗传算法介绍 |
25-26 |
|
3.2.3.2 算法性能分析 |
26-27 |
|
3.3 属性值约简算法的研究与分析 |
27-34 |
|
3.3.1 属性值约简概述 |
27-28 |
|
3.3.2 一般值约简算法 |
28 |
|
3.3.3 以核值为基础的值约简算法 |
28-29 |
|
3.3.4 启发式值约简算法 |
29 |
|
3.3.5 值约简算法的应用与分析 |
29-34 |
|
3.4 本章小结 |
34-35 |
|
第四章 属性约简的启发式算法研究 |
35-49 |
|
4.1 算法简述及预备知识 |
35-37 |
|
4.2 基于信息量的属性约简算法 |
37-42 |
|
4.2.1 基于互信息的属性约简算法——MIBARK算法 |
37 |
|
4.2.2 基于条件熵的属性约简 |
37-39 |
|
4.2.3 基于信息量算法的比较分析 |
39-42 |
|
4.3 属性频度算法的研究与改进 |
42-48 |
|
4.3.1 属性频度算法 |
42-43 |
|
4.3.2 属性频度算法的改进 |
43-44 |
|
4.3.3 实验分析 |
44-48 |
|
4.4 本章小结 |
48-49 |
|
第五章 粗糙集理论在入侵检测中的应用 |
49-56 |
|
5.1 入侵检测简述 |
49-51 |
|
5.1.1 入侵检测概念和分类 |
49-50 |
|
5.1.2 入侵检测系统的架构 |
50-51 |
|
5.2 实验仿真 |
51-55 |
|
5.2.1 实验环境和实验数据的选择 |
51-52 |
|
5.2.2 数据的预处理 |
52-53 |
|
5.2.3 实验结果分析 |
53-55 |
|
5.3 本章小结 |
55-56 |
|
第六章 总结与展望 |
56-58 |
|
6.1 本文研究内容及成果 |
56 |
|
6.2 展望 |
56-58 |
|
致谢 |
58-59 |
|
参考文献 |
59-62 |
|
| 【DOI】 | LunWen.ID:2.2008.388289 |