| 【中文题名】 | 基于支持向量机的特征提取方法研究与应用 |
| 【英文题名】 | A Study of Feature Selection Method Based on Support Vector Machine and Its Application |
| 【学科专业】 | 软件工程 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2007-5-31 |
| 【中关键词】 | 支持向量机,特征提取,多类分类,II型糖尿病,预测系统, |
| 【英关键词】 | SVM,Feature-selection,Multi-classsification,Type II diabetes,Forecast system, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>自动化基础理论>人工智能理论>自动推理、机器学习> |
| 【论文摘要】 |
统计学习理论是一种专门研究有限样本情况下机器学习规律的理论,它不仅考虑了对推广能力的要求,而且追求在现有有限信息的条件下得到最优结果。支持向量机是在统计学习理论的基础上发展而来的一种新的机器学习方法,在解决有限样本、非线性及高维模式识别问题中表现出许多特有的优势。
本文提出了一种用于最佳特征子集选取的特征筛选算法,且实现了特征与分类识别相关性强度的排序,并通过使用该算法对II型糖尿病判别与风险因素筛选,求证了该方法的可靠性和可行性。本文将该算法称为Feature-ltrate算法。当以该算法提取的特征子集{腰围、腰围/臀围、舒张血压、年龄)作为输入向量时,敏感度、特异性、准确率最高,分别为0.8666、0.6420、0.7014。同时,为了比较该方法的优越性,本文还采用了决策树、多层感知器建立类似模型分析同一数据集做比较。本文还将Feature-iltrate算法与主成分分析法进行比较。试验表明,在特征提取方面该算法优于主成分分析法。因此,基于支持向量机的FeatureFiltrate算法对风险因素筛选、分类识别是一种有效的方法,为解决该类问题探索了一条有效途径。而且,本文采用决策树的思想对... |
| 【论文题纲】 |
|
摘要 |
7-8 |
|
Abstract |
8-10 |
|
第1章 绪论 |
10-15 |
|
1.1 机器学习理论 |
10-11 |
|
1.2 国内外研究状况 |
11-13 |
|
1.3 本文的主要研究内容和研究意义 |
13-15 |
|
1.3.1 研究内容 |
13 |
|
1.3.2 研究意义 |
13-15 |
|
第2章 统计学习理论 |
15-23 |
|
2.1 机器学习 |
15-17 |
|
2.1.1 机器学习问题 |
15-16 |
|
2.1.2 经验风险 |
16-17 |
|
2.2 学习过程一致性的条件 |
17-18 |
|
2.3 推广性的界 |
18-19 |
|
2.4 VC 维 |
19-20 |
|
2.5 结构风险最小化 |
20-22 |
|
2.5.1 结构风险最小化 |
20-21 |
|
2.5.2 SRM 原则的实现 |
21-22 |
|
2.6 小结 |
22-23 |
|
第3章 特征筛选及 II 型糖尿病预测 |
23-44 |
|
3.1 支持向量机方法 |
23-28 |
|
3.1.1 最优分类平面 |
23-25 |
|
3.1.2 广义最优分类面 |
25 |
|
3.1.3 支持向量机 |
25-27 |
|
3.1.4 SMO 算法 |
27-28 |
|
3.2 特征筛选算法 |
28-29 |
|
3.3 糖尿病研究背景 |
29-30 |
|
3.4 数据库 |
30 |
|
3.5 执行概述 |
30 |
|
3.6 数据预处理 |
30-31 |
|
3.7 分类预测模型 |
31-34 |
|
3.7.1 十折交叉验证 |
31-32 |
|
3.7.2 输入向量 |
32-34 |
|
3.8 风险因素筛选及 Feature.Filtrate 算法应用 |
34 |
|
3.9 实验结果分析 |
34-36 |
|
3.10. Feature-Filtrate 算法与主成分分析的比较 |
36-40 |
|
3.10.1 主成分分析原理及过程 |
36-37 |
|
3.10.2 试验结果比较 |
37-40 |
|
3.11 特征筛选方法的扩展 |
40-42 |
|
3.11.1 特征筛选算法的局限性与决策树 |
40-41 |
|
3.11.2 基于支持向量机的特征筛选算法扩展 |
41-42 |
|
3.12 小结 |
42-44 |
|
第4章 II 型糖尿病预测系统实现 |
44-57 |
|
4.1 需求分析 |
44-46 |
|
4.1.1 设计目标 |
44 |
|
4.1.2 需求规格说明 |
44-45 |
|
4.1.3 用例模型 |
45-46 |
|
4.1.4 功能描述 |
46 |
|
4.2 设计 |
46-51 |
|
4.2.1 体系结构设计 |
46-48 |
|
4.2.2 详细设计 |
48-49 |
|
4.2.3 系统的模块结构 |
49-50 |
|
4.2.4 界面设计 |
50-51 |
|
4.3 实现 |
51-55 |
|
4.3.1 前台处理系统 |
51-54 |
|
4.3.2 后台管理系统 |
54-55 |
|
4.4 小结 |
55-57 |
|
结论 |
57-59 |
|
参考文献 |
59-63 |
|
致谢 |
63-64 |
|
附录A(攻读学位期间所发表的学术论文) |
64 |
|
| 【DOI】 | LunWen.ID:2.2008.388451 |