| 【中文题名】 | 基于双向距离关联和径向基神经网络的属性约简算法研究 |
| 【英文题名】 | Research on Attribute Reduction Based on Bi-directional Distance Correlation and Radial Basis Network |
| 【学科专业】 | 计算机软件与理论 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2007-9-17 |
| 【中关键词】 | 数据预处理,属性约简,双向距离关联,径向基神经网络,双重监督属性选择,混合网络学习 |
| 【英关键词】 | Data Pretreatment,Attribute Reduction,Bi-directional Distance & Correlation,Radial Basis Neural Network,Improved Addition and Subtraction Combination Strategy,Dual Supervised Attribute Selection,Mixed Network Study, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>自动化基础理论>人工智能理论>人工神经网络与计算> |
| 【论文摘要】 |
随着信息社会数据量的日益增加,人们迫切需要有效的数据挖掘来发现其中的知识。数据挖掘的好坏不仅决定于挖掘的算法有效性,更决定于待挖掘数据的质量。数据预处理可以为数据挖掘提供高质量输入数据,是能够挖掘出有用知识的前提。属性约简是目前数据预处理研究的热点之一。
本文针对目前多数属性约简算法只适用于分类输出的局限性,采用启发式属性过滤和学习算法融合验证的打包思想,提出了一种基于双向距离关联法(BDDC)和径向基网络(RBNN)的属性约简算法。算法用本文提出的双向距离关联方法对属性进行重要性评价,根据重要性排序使用改进的加减结合策略进行属性子集选择;然后采用径向基神经网络对已选出的子集进行第二层监督验证。最后,本文采用采用中国城市竞争力数据库及城市气候库对算法的可行性和有效性进行了实验验证。
相对于输入输出关联法,基于BDDC和RBNN的属性约简算法具有以下改进:算法提出的BDDC属性重要性度量方法综合考虑纵向和横向输入输出关联,分别针对分类和拟合数据设计了不同的度量函数,而且纵向关联综合考虑到纵向输入输出变化的大小及方向,横向关联计算了输入输出的直接横向因果联系,兼顾了属性的不平等性。算法采... |
| 【论文题纲】 |
|
摘要 |
4-5 |
|
Abstract |
5-10 |
|
第一章 绪论 |
10-19 |
|
1.1 数据挖掘与数据预处理 |
10-14 |
|
1.1.1 数据挖掘概述 |
10-11 |
|
1.1.2 数据挖掘与数据预处理 |
11-13 |
|
1.1.3 课题的提出 |
13-14 |
|
1.2 属性约简的发展现状 |
14-18 |
|
1.2.1 属性约简概述 |
14-15 |
|
1.2.2 属性子集选择 |
15-16 |
|
1.2.3 属性重要性度量 |
16 |
|
1.2.4 学习算法 |
16-17 |
|
1.2.5 搜索策略 |
17-18 |
|
1.3 课题来源 |
18 |
|
1.4 论文内容和结构 |
18-19 |
|
第二章 属性约简 |
19-31 |
|
2.1 数据预处理 |
19-24 |
|
2.1.1 数据质量与数据预处理 |
19-20 |
|
2.1.2 数据预处理的功能和策略 |
20-22 |
|
2.1.3 数据预处理主要方法 |
22-24 |
|
2.2 属性约简 |
24-31 |
|
2.2.1 属性子集选择 |
25-26 |
|
2.2.2 启发式属性子集选择 |
26-27 |
|
2.2.3 属性重要性度量和属性子集的评价 |
27-29 |
|
2.2.4 属性约简算法研究现状和问题 |
29-31 |
|
第三章 径向基神经网络 |
31-41 |
|
3.1 引言 |
31 |
|
3.2 多层前向BP网络 |
31-34 |
|
3.2.1 BP神经网络的原理 |
31-33 |
|
3.2.2 BP神经网络的缺点 |
33-34 |
|
3.3 径向基神经网络 |
34-41 |
|
3.3.1 径向基网络的理论基础 |
35-37 |
|
3.3.2 径向基函数 |
37-38 |
|
3.3.3 RBNN的拓扑结构与原理 |
38-39 |
|
3.3.4 RBNN的学习方法 |
39-41 |
|
第四章 基于双向距离关联和径向基网络的属性约简 |
41-57 |
|
4.1 引言 |
41-42 |
|
4.2 属性重要性度量 |
42-46 |
|
4.2.1 分离联系法 |
42 |
|
4.2.2 输入输出关联法 |
42-43 |
|
4.2.3 双向距离关联法 |
43-46 |
|
4.3 径向基神经网络的设计 |
46-51 |
|
4.4 基于BDDC度量和RBNN的属性约简思想 |
51-53 |
|
4.4.1 数据准备 |
51-52 |
|
4.4.2 属性约简 |
52-53 |
|
4.5 基于BDDC和RBNN的属性约简算法描述 |
53-56 |
|
4.5.1 算法流程图 |
53-55 |
|
4.5.2 算法伪代码 |
55-56 |
|
4.6 本章小结 |
56-57 |
|
第五章 算法仿真验证 |
57-70 |
|
5.1 中国城市竞争力数据库 |
57-64 |
|
5.1.1 数据库介绍 |
57-58 |
|
5.1.2 属性约简 |
58-64 |
|
5.2 中国内地城市竞争力数据库 |
64-67 |
|
5.3 中国主要城市气候数据库 |
67-70 |
|
总结 |
70-72 |
|
参考文献 |
72-76 |
|
攻读硕士学位期间发表的学术论文 |
76-77 |
|
致谢 |
77 |
|
| 【DOI】 | LunWen.ID:2.2008.388887 |