| 【中文题名】 | 面向数字字符识别的粗糙集属性约简算法研究 |
| 【英文题名】 | The Research of Rough Set Attribute Reduction Algorithm in Numeral Character Recognition |
| 【学科专业】 | 控制理论与控制工程 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2006-1-13 |
| 【中关键词】 | 粗糙集,属性约简,属性选择,一致性,分支定界,过滤算法 |
| 【英关键词】 | rough set,attributes reduction,feature selections consistency,branch and bounds filters genetic algorithm,similarity based rough set models,character recognition, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>自动化基础理论>人工智能理论>> |
| 【论文摘要】 | 属性选择是机器学习的核心问题之一,它关系到归纳算法的复杂性和学习性能。与目标概念不相关的或受噪声干扰的属性会严重降低学习效果,而粗糙集属性约简是一种有效的消减冗余属性、选择与目标概念强相关属性子集的方法。由于经典Rough集主要面向nominal attribute对象,处理通常包含噪声和干扰数据的数值型对象时有很大局限。本文的研究内容主要集中于Rough集理论对数值型属性对象的约简算法及其在数字字符识别中的应用,结合属性选择的基本准则提出面向数值属性约简的评价函数并设计对应的搜索算法,这些约简算法完全适用于nominal attribute。
具体研究工作如下:一.在Rough集的基本算法方面,提出了计算等价类的快速算法和增量算法以及计算正区域的改进算法,分析了算法的时间复杂度;改进了最短属性约简GA的适应度函数,引入特定有效位变异算子,以提高GA搜索效率。二.针对数据集包含噪声和干扰问题,提出利用属性同类一致性选择抗干扰属性。定义了两种结合一致性的属性重要度:1.熵函数形式的类内一致性判据J_C,度量同类样本属性分布的随机性;2.根据样本同类相似和不同类相异概率定义的属性综合分辨力W(·)。... |
| 【论文题纲】 |
|
第一章 绪论 |
13-26 |
|
1.1 粗糙集的研究现状 |
13-16 |
|
1.1.1 粗糙集理论的发展历程 |
13-14 |
|
1.1.2 粗糙集的研究方向 |
14-16 |
|
1.2 粗糙集的基本知识 |
16-19 |
|
1.2.1 知识表达系统和决策表 |
16-17 |
|
1.2.2 近似空间与粗糙集模型 |
17-19 |
|
1.3 属性约简概念 |
19-20 |
|
1.4 属性选择机制 |
20-24 |
|
1.4.1 属性选择的基本问题 |
20-21 |
|
1.4.2 属性价值 |
21-24 |
|
1.4.2.1 粗糙集概念下的属性重要性 |
21-22 |
|
1.4.2.2 特征子集的评价指标 |
22-24 |
|
1.5 本文主要工作概述 |
24-26 |
|
第二章 粗糙集基本算法 |
26-39 |
|
2.1 不可分辨关系IND(B) |
26-30 |
|
2.1.1 基本算法 |
26-27 |
|
2.1.2 快速算法 |
27-28 |
|
2.1.3 增量算法 |
28-30 |
|
2.2 正区域POSP(Q) |
30-31 |
|
2.3 属性核CORE |
31-33 |
|
2.3.1 可分辨矩阵求核CORE方法 |
31-32 |
|
2.3.2 利用属性依赖性求核属性 |
32-33 |
|
2.4 属性约简算法 |
33-38 |
|
2.4.1 常用约简算法 |
33-36 |
|
2.4.2 约简的完备算法 |
36-38 |
|
2.4.3 其他约简方法 |
38 |
|
2.5 本章小结 |
38-39 |
|
第三章 属性约简的遗传算法 |
39-52 |
|
3.1 约简的基本遗传算法框架和流程 |
40 |
|
3.2 粗糙集属性约简问题解空间的编码 |
40-41 |
|
3.3 适应度函数 |
41-44 |
|
3.3.1 加权型适应度函数及存在的问题 |
41-44 |
|
3.3.2 分段适应度函数 |
44 |
|
3.4 遗传算子设计 |
44-47 |
|
3.4.1 选择 |
44-45 |
|
3.4.2 交叉 |
45-46 |
|
3.4.3 变异 |
46-47 |
|
3.5 实验分析 |
47-50 |
|
3.5.1 适应度函数对进化过程的影响 |
48-49 |
|
3.5.2 变异算子对进化过程的影响 |
49-50 |
|
3.6 本章小结 |
50-52 |
|
第四章 基于类内一致性的属性约简 |
52-60 |
|
4.1 类内一致性判据J_C |
52-54 |
|
4.2 属性约简集的搜索算法 |
54-56 |
|
4.2.1 分支定界法 |
54-56 |
|
4.2.2 filter方法 |
56 |
|
4.3 实验分析 |
56-59 |
|
4.4 本章小结 |
59-60 |
|
第五章 基于属性综合分辨力的约简算法SDAR |
60-76 |
|
5.1 属性综合分辨力的评价 |
60-61 |
|
5.2 分辨信息表Distinction Table |
61-66 |
|
5.2.1 分辨信息表的结构 |
61-63 |
|
5.2.2 分辨信息表的分解 |
63-65 |
|
5.2.3 分辨信息表与分辨矩阵、二进制分辨矩阵的关系 |
65-66 |
|
5.3 基于属性综合分辨力的约简算法SDAR |
66-72 |
|
5.3.1 定义于等价关系上的约简算法SDAR_EQR |
66-68 |
|
5.3.2 定义于相似关系上的约简算法SDAR_SIMR |
68-72 |
|
5.3.2.1 经典粗集模型对数值属性对象分类的局限 |
68-69 |
|
5.3.2.2 相似关系粗集模型(Similarity based Rough Set model)及约简 |
69-70 |
|
5.3.2.3 相似关系粗糙集的属性约简算法SDAR_SIMR |
70-72 |
|
5.4 实验分析 |
72-75 |
|
5.5 本章小结 |
75-76 |
|
第六章 全文总结 |
76-78 |
|
参考文献 |
78-79 |
|
| 【DOI】 | LunWen.ID:2.2008.387596 |