| 【中文题名】 | 基于交互信息的连续属性决策树学习算法 |
| 【英文题名】 | Using Mutual Information for Selecting Continuous-valued Attribute in Decision Tree Learning |
| 【学科专业】 | 基础数学 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2004-9-20 |
| 【中关键词】 | 归纳学习,机器学习,决策树,最小信息熵,交互信合,单边三角形模糊数 |
| 【英关键词】 | Inductive learning,Machine learning,Decision tree,Information entropy minimization,Mutual information,One-side triangular fuzzy number, |
| 【分类导航】 | 数理科学和化学>数学>代数、数论、组合理论>模糊数学>> |
| 【论文摘要】 | Fayyad决策树学习算法的核心是使用信息熵的下降速度作为选取扩展属性标准的启发式,但它仅考虑了条件属性与决策属性的关系,没有考虑条件属性间的关系(即交互性),因此极有可能选择对继续分类无实际意义或意义相对不大的冗余属性,不能实现信息熵的真正减少。基于此种考虑,本文给出该算法的一个改进版本,它在选择扩展属性时不仅要求该属性带来的信息熵尽可能小,而且要求其与已经使用过的各属性之间的交互性(即交互信息)尽可能小。本文首先从全局角度描述这两种算法,然后从训练准确率与测试准确率,决策树的结构等方面对这两种算法进行了比较,归纳出交互信息在决策树学习算法中的作用,证明了改进算法的有效性;同时考虑将Fayyad决策树学习算法在单边三角形模糊数属性意义下进行推广,对于单边三角形模糊数属性构造出一种决策树学习算法,并对算法的复杂度,效率进行了分析。 |
| 【论文题纲】 |
|
摘要 |
4-5 |
|
ABSTRACT |
5-7 |
|
第1章 绪论 |
7-11 |
|
1.1 背景知识 |
7-8 |
|
1.2 决策树归纳学习的产生及研究现状 |
8-10 |
|
1.3 本文的研究重点和主要内容 |
10-11 |
|
第2章 FAYYAD决策树学习算法 |
11-17 |
|
2.1 算法简介 |
11-15 |
|
2.2 学习算法中关于属性的最优割点的讨论 |
15-17 |
|
第3章 基于交互信息的连续属性决策树学习算法 |
17-24 |
|
3.1 算法简介 |
17-20 |
|
3.2 两种算法的比较 |
20-24 |
|
第4章 单边三角形模糊数属性决策树学习算法 |
24-33 |
|
4.1 算法简介 |
24-29 |
|
4.2 学习算法中关于最优割点的讨论 |
29-33 |
|
第5章 结束语 |
33-34 |
|
参考文献 |
34-37 |
|
攻读硕士学位期间科研工作情况 |
37-38 |
|
致谢 |
38 |
|
| 【DOI】 | LunWen.ID:2.2008.11903 |