| 【中文题名】 | 分布式异构数据的统计机器学习方法研究 |
| 【英文题名】 | Statistical Machine Learning Algorithm Study on Distributed Heterogeneous Data |
| 【学科专业】 | 控制科学与工程 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2007-6-27 |
| 【中关键词】 | 分布式机器学习,异构数据分析,高斯混合模型,元数据分析,, |
| 【英关键词】 | distributed machine learning,heterogeneous data analysis,Gaussian mixture model,meta-analysis, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>自动化基础理论>人工智能理论>自动推理、机器学习> |
| 【论文摘要】 |
随着计算机技术和电子通信技术的飞速发展越来越多的分布式计算环境出现在我们的工作和生活中如Internet intranets传感器网络等分布式环境中存在大量的数据存储和计算结点如何充分利用这些分散着的计算资源来处理分布式环境中的数据已经成为机器学习和数据挖掘研究中的一个热点问题
根据分布式计算环境中的数据是否来源于同一样本空间分布式机器学习的研究工作可分为分布式同构学习和分布式异构学习后者相比之下更具有挑战性和应用价值也是本论文所关注的焦点
多元数据的主成分分析是诸多统计机器学习算法的基础本文提出了一种基于协方差分解的分布式异构数据主成分分析方法理论分析和实验结果表明本文给出的算法和以往的同类算法相比具有更高的效率和精度在该算法的推导过程中我们给出了异构数据充分统计量的分布式估计方法使得其它一些基于多元统计模型的分布式学习算法也可以比较容易地移植到分布式异构数据集上
和上述非监督学习方法相比在部分或全部监督信息可取得的情况下基于这些监督信息进行特征选择有助于进一步提高学习机器的精度本文提出了可用于分布式异构数据的半监督特征选择算法以及一种基于Markov Blanket辨识的... |
| 【论文题纲】 |
|
摘要 |
3-4 |
|
Abstract |
4-7 |
|
第1章 引言 |
7-16 |
|
1.1 研究背景和意义 |
7-8 |
|
1.2 国内外研究现状 |
8-14 |
|
1.2.1 相关的研究方向 |
8-9 |
|
1.2.2 分布式同构学习算法 |
9-11 |
|
1.2.3 分布式异构学习算法 |
11-14 |
|
1.3 本文的工作和安排 |
14-16 |
|
第2章 分布式异构数据主成分分析 |
16-28 |
|
2.1 问题陈述 |
16-18 |
|
2.2 分布式同构数据主成分分析 |
18-20 |
|
2.3 分布式异构数据主成分分析 |
20-26 |
|
2.4 实验结果 |
26-28 |
|
第3章 分布式数据集上的特征选择 |
28-42 |
|
3.1 异构数据的半监督特征选择 |
28-33 |
|
3.1.1 特征间概率依赖关系的图模型表示 |
29-30 |
|
3.1.2 图模型边上的权值 |
30-32 |
|
3.1.3 随机游走模型 |
32-33 |
|
3.2 基于分布式Markov Blanket 的特征选择 |
33-40 |
|
3.2.1 互信息和贝叶斯错误率 |
33-34 |
|
3.2.2 局部Markov Blanket 学习 |
34-35 |
|
3.2.3 为全局学习采集样本 |
35-37 |
|
3.2.4 全局Markov Blanket 学习 |
37-39 |
|
3.2.5 特征选择方法 |
39-40 |
|
3.3 实验结果 |
40-42 |
|
第4章 面向分布式异构数据的混合模型参数估计 |
42-64 |
|
4.1 分布式异构数据聚类和容错计算 |
42-56 |
|
4.1.1 GMM 与分布式EM 算法 |
43-44 |
|
4.1.2 DEM 算法框架及其收敛性 |
44-45 |
|
4.1.3 容错分布式 EM 算法 |
45-46 |
|
4.1.4 基于FEM 算法的参数更新 |
46-49 |
|
4.1.5 参数U 的近似更新方法 |
49-52 |
|
4.1.6 分布式 FEM 算法的传输负荷 |
52-53 |
|
4.1.7 实验结果 |
53-56 |
|
4.2 异构元数据分析 |
56-64 |
|
4.2.1 元数据统计方法 |
58 |
|
4.2.2 混合随机效应模型中的参数更新 |
58-60 |
|
4.2.3 在医学数据挖掘中的应用 |
60-64 |
|
第5章 结论 |
64-66 |
|
参考文献 |
66-71 |
|
致谢 |
71-72 |
|
个人简历 在学期间发表的学术论文与研究成果 |
72 |
|
| 【DOI】 | LunWen.ID:2.2008.388603 |