| 【中文题名】 | 基于数据挖掘技术预测2型糖尿病慢性并发症 |
| 【英文题名】 | Predications of Chronic Type-2-diabetes-related Complications Based on Data Mining |
| 【学科专业】 | 生物医学工程 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2006-7-21 |
| 【中关键词】 | 2型糖尿病,糖尿病慢性并发症,数据挖掘,学习向量量化神经网络,LOGISTIC回归, |
| 【英关键词】 | Type 2 Diabetes,complications of T2D,Data Mining,Learning Vector Quantization neural network,Logistic Regression, |
| 【分类导航】 | 医药、卫生>基础医学>医用一般科学>其他科学技术在医学上的应用>> |
| 【论文摘要】 | 糖尿病已成为全球性重大公共卫生问题,患者大、微血管并发症的发病率极高,二者已成为影响糖尿病患者生活质量、致残致死的主要原因。本研究旨在通过分析2型糖尿病病人的临床资料和实验数据预测糖尿病慢性并发症,为研究和控制2型糖尿病慢性并发症提供帮助。
数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的随机数据中,提取蕴含在其中的、不为人知但又具有潜在价值的信息和知识的过程。数据挖掘是面向应用的技术,在临床医学诊断中,应用数据挖掘技术的原理,通过对大量诊断数据的挖掘来建立预测模型,可以作为决策时的依据和指南,对临床医学作辅助诊断,从而提高临床诊断的准确性。
本文的研究内容分三个方面:(1)建立糖尿病并发症预测的学习向量量化神经网络模型并对测试集进行测试;(2)建立糖尿病并发症预测的LOGISTIC回归模型并对测试集进行测试;(3)利用LOGISTIC回归筛选变量,建立糖尿病并发症预测的学习向量量化神经网络模型。通过上述不同方法,我们将明确2型糖尿病患者的临床资料和实验室指标与糖尿病慢性并发症间的关系,并建立不同糖尿病并发症的预测模型。
研究的主要路线和方法是:首先对收集的数据进行数据预处... |
| 【论文题纲】 |
|
缩略语 |
6-7 |
|
中文摘要 |
7-9 |
|
英文摘要 |
9-11 |
|
第一章 绪论 |
11-18 |
|
1.1 立论背景 |
11-12 |
|
1.2 数据挖掘技术的基本原理和主要方法 |
12-15 |
|
1.2.1 数据挖掘的概念和基本原理 |
13 |
|
1.2.2 数据挖掘的步骤 |
13-14 |
|
1.2.3 数据挖掘的分类和方法 |
14-15 |
|
1.2.4 数据挖掘的发展趋势 |
15 |
|
1.3 研究内容和创新 |
15-18 |
|
1.3.1 医学数据挖掘意义 |
15-16 |
|
1.3.2 本文的主要研究内容 |
16-17 |
|
1.3.3 本文的创新 |
17-18 |
|
第二章 糖尿病并发症及临床资料采集 |
18-27 |
|
2.1 2型糖尿病患者临床检验指标的采集 |
18-20 |
|
2.1.1 2型糖尿病的定义 |
18 |
|
2.1.2 一般临床查体指标 |
18-19 |
|
2.1.3 血糖控制和胰岛素敏感性指标 |
19 |
|
2.1.4 脂肪代谢指标 |
19-20 |
|
2.1.5 肾功能指标 |
20 |
|
2.2 糖尿病患者并发症的观察确诊及简单统计量描述 |
20-27 |
|
2.2.1 糖尿病合并心脏病 |
20-22 |
|
2.2.2 糖尿病肾脏并发症 |
22-23 |
|
2.2.3 糖尿病视网膜并发症 |
23-24 |
|
2.2.4 糖尿病与下肢动脉栓塞 |
24-25 |
|
2.2.5 糖尿病神经病变 |
25-27 |
|
第三章 数据的预处理 |
27-34 |
|
3.1 数据预处理的概念和意义 |
27 |
|
3.2 数据预处理的步骤和方法 |
27-28 |
|
3.3 本研究中所用的数据预处理技术 |
28-34 |
|
3.3.1 多重线性回归及用其填充缺失值 |
28-31 |
|
3.3.2 线性方法标准化数据 |
31-32 |
|
3.3.3 主成分分析 |
32-34 |
|
第四章 建立糖尿病并发症预测模型的原理 |
34-44 |
|
4.1 应用学习向量量化神经网络建立预测模型 |
34-37 |
|
4.1.1 聚类分析 |
34 |
|
4.1.2 学习向量量化神经网络的基本原理 |
34-37 |
|
4.2 基于统计学中Logistic回归的预测 |
37-39 |
|
4.2.1 Logit变换和Logistic回归模型 |
37-38 |
|
4.2.2 解释回归系数 |
38-39 |
|
4.2.3 概率预测 |
39 |
|
4.3 本论文中预测糖尿病慢性并发症的思路 |
39-44 |
|
4.3.1 LVQ神经网络预测模型的建立 |
40 |
|
4.3.2 LOGISTIC回归预测模型的建立 |
40 |
|
4.3.3 LOGISTIC回归与LVQ网络结合使用建立预测模型 |
40-44 |
|
第五章 预测模型的参数调试和模型预测结果 |
44-59 |
|
5.1 神经网络预测模型 |
44-49 |
|
5.1.1 建立神经网络和网络的参数调试 |
44-47 |
|
5.1.2 数据预处理与网络训练 |
47-48 |
|
5.1.3 五种慢性糖尿病并发症神经网络预测结果 |
48-49 |
|
5.2 Logistic回归预测模型 |
49-56 |
|
5.2.1 参数估计与Wald检验结果 |
49-53 |
|
5.2.2 糖尿病并发症回归模型的假设检验 |
53-54 |
|
5.2.3 用建立的Logistic回归模型进行预测 |
54-55 |
|
5.2.4 简单统计描述与LOGISTIC回归比较 |
55-56 |
|
5.3 统计学与神经网络方法结合进行预测 |
56-58 |
|
5.4 三种预测方法的比较 |
58-59 |
|
第六章 结论和讨论 |
59-63 |
|
6.1 结论 |
59 |
|
6.2 讨论和思考 |
59-63 |
|
6.2.1 关于数据挖掘在医学中的应用 |
59-60 |
|
6.2.2 关于人工神经网络的应用 |
60-61 |
|
6.2.3 关于三种方法的比较 |
61-62 |
|
6.2.4 关于方法的局限性及待解决的问题 |
62-63 |
|
参考文献 |
63-68 |
|
致谢 |
68-69 |
|
攻读硕士学位期间发表的论文 |
69 |
|
| 【DOI】 | LunWen.ID:2.2008.204583 |