| 【中文题名】 | 基于聚类的数据预处理对模糊决策树归纳的影响 |
| 【英文题名】 | Clustering-Based Data Preprocessing's Impact on Fuzzy Decision Tree Induction |
| 【学科专业】 | 计算机应用 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2006-11-14 |
| 【中关键词】 | 模糊决策树归纳,模糊集合理论,数据预处理,模糊化,聚类,隶属函数 |
| 【英关键词】 | Fuzzy Decision Tree Induction,Fuzzy Set Theory,Data Preprocessing,Fuzzification,Clustering,Membership Function, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>自动化基础理论>人工智能理论>> |
| 【论文摘要】 | 决策树是目前商业数据挖掘工具中使用最为广泛的算法。它是一种逼近离散值目标函数的归纳推理方法,在这种方法中学习到的函数被表示为一棵决策树。这个决策树模型能够表示发现描述类别的模式,用于完成预测任务。决策树是目前用于预测和分类的主要技术,特别是商用领域,已经被成功地应用到从学习医疗诊断到学习评估贷款申请的信用风险的广阔领域。简而言之,决策树能够帮助你将数据转换成知识。
引入模糊数学,使得决策树技术的应用领域更为广泛,处理的数据类型更多。相应出现的数据的模糊化预处理方法,作为模糊决策树系统的一个重要组成部分,同样会对模糊决策树的性能产生重要影响,这也是本文研究的重点。研究发现,模糊化方法使用的隶属函数的位置分布影响数据模糊化的效果,进而影响模糊决策树的执行效率、精度和规模。Kohonen聚类算法能够用来选取连续属性值的中心点,用以确定隶属函数的位置。实验研究表明,将聚类引入数据模糊化预处理,能够调整隶属函数之间的过渡区域,即使得模糊子集之间的覆盖范围不再相同,因而能够更合理地表示模糊概念之间的重叠关系。通过与其它算法比较的结果显示将聚类引入数据模糊化预处理,能够使模糊决策树获得更高的精度。 |
| 【论文题纲】 |
|
第1章 绪论 |
8-12 |
|
1.1 研究背景与意义 |
8 |
|
1.2 本课题的国内外发展现状 |
8-10 |
|
1.3 本课题研究的主要内容 |
10-12 |
|
第2章 模糊决策树学习 |
12-20 |
|
2.1 模糊逻辑 |
12-14 |
|
2.1.1 模糊集与隶属函数 |
12-13 |
|
2.1.2 模糊集的表示方法 |
13-14 |
|
2.2 数据分类 |
14-15 |
|
2.2.1 分类的目的 |
14-15 |
|
2.2.2 分类器的构造 |
15 |
|
2.3 决策树学习 |
15-16 |
|
2.4 模糊决策树学习 |
16-20 |
|
2.4.1 分类问题中不确定性的表示 |
17-18 |
|
2.4.2 不确定性的度量 |
18-19 |
|
2.4.3 模糊决策树启发式算法 |
19-20 |
|
第3章 数据预处理对模糊决策树归纳的影响 |
20-36 |
|
3.1 数据预处理的基本功能 |
20-21 |
|
3.2 离散化数据预处理 |
21 |
|
3.3 模糊化数据预处理 |
21-22 |
|
3.4 引入聚类 |
22 |
|
3.5 隶属函数位置分布的确定 |
22-24 |
|
3.5.1 简单等分法 |
23 |
|
3.5.2 聚类算法 |
23-24 |
|
3.6 隶属函数的选择 |
24-25 |
|
3.6.1 三角形函数 |
24-25 |
|
3.6.2 高斯函数 |
25 |
|
3.7 模糊决策树推理系统的设计实现 |
25-30 |
|
3.7.1 数据预处理 |
26-27 |
|
3.7.2 Min-Ambiguity启发式算法 |
27-28 |
|
3.7.3 匹配应用 |
28-30 |
|
3.8 实验过程与分析 |
30-36 |
|
3.8.1 实验过程 |
30 |
|
3.8.2 实验结果 |
30-34 |
|
3.8.3 实验分析 |
34-35 |
|
3.8.3 结论分析 |
35-36 |
|
第4章 总结与展望 |
36-37 |
|
参考文献 |
37-39 |
|
攻读硕士学位期间科研工作情况 |
39-40 |
|
致谢 |
40 |
|
| 【DOI】 | LunWen.ID:2.2008.388030 |