| 【中文题名】 | 万亿次机群系统NPB性能评测与并行非数值算法实现及性能分析 |
| 【英文题名】 | NPB Performance Evaluation of Tera-Scale Clusters and Implementation of Parallel Non-Numerical Algorithm with Performance Analysis |
| 【学科专业】 | 计算机软件与理论 |
| 【论文级别】 | 硕士论文 |
| 【投稿时间】 | 2005-7-8 |
| 【中关键词】 | 万亿次机群系统,性能评侧,NPB,并行数据挖掘,关联规则, |
| 【英关键词】 | tera-scale cluster system,performance evaluation,NPB (NAS Parallel Benchmarks),parallel data mining,association rules, |
| 【分类导航】 | 工业技术>自动化技术、计算机技术>计算技术、计算机技术>电子数字计算机(不连续作用电子计算机)>各种电子数字计算机> |
| 【论文摘要】 | 高性能计算正处于一个新的快速发展时期,有两个现象值得关注,一方面,并行计算机的峰值性能提升迅速,峰值计算速度高达百万亿次的计算机系统已经被研制成功,高性价比的机群(cluster)成为高性能计算机的主流架构,促进了高性能计算在更多领域的普及应用;另一方面,并行应用软件缺乏,高性能计算机的实际效率长期以来处于较低水平,当前大型并行应用软件仅能发挥20%以下的系统峰值性能。
应用性能才是用户最关心的,也是最重要的。并行软件和应用水平已经成为高性能计算发展中的薄弱环节,应该给予更多的重视。并行计算机和并行应用程序是影响并行计算性能的两个主要方面,也是本文的研究重点。
本文以3个万亿次机群系统为平台,利用有着很强应用背景的NPB(NAS Parallel Benchmarks)进行性能测试分析。NPB程序包的8个程序都来自于实际应用领域,是科学计算领域并行应用的典型代表,NPB性能评测属于面向应用的性能评测,可以较真实地表现出系统的拟应用性能。
通过NPB测试,重点研究在大规模并行处理时(处理器数目达到上千个)系统的性能特点和趋势。分析了不同的处理器、互连网络等系统配置对NPB性能... |
| 【论文题纲】 |
|
目录 |
7-9 |
|
引言 |
9-11 |
|
第一章 绪论 |
11-25 |
|
1.1 研究背景 |
11-18 |
|
1.1.1 高性能计算简介 |
11-12 |
|
1.1.2 高性能并行计算机与机群系统 |
12-16 |
|
1.1.3 并行编程模型 |
16-17 |
|
1.1.4 高性能计算应用现状 |
17-18 |
|
1.2 高性能并行计算机性能评测 |
18-24 |
|
1.2.1 性能评测的意义 |
18-19 |
|
1.2.2 高性能并行计算机主要性能参数 |
19 |
|
1.2.3 基准程序介绍 |
19-22 |
|
1.2.4 高效能计算系统及其测试 |
22-24 |
|
1.3 本章小节 |
24-25 |
|
第二章 测试环境 |
25-33 |
|
2.1 曙光4000A |
25-28 |
|
2.1.1 简介 |
25-26 |
|
2.1.2 硬件系统 |
26 |
|
2.1.3 软件系统 |
26 |
|
2.1.4 Opteron64位计算介绍 |
26-28 |
|
2.2 深腾6800超级机群系统 |
28-30 |
|
2.2.1 简介 |
28 |
|
2.2.2 硬件系统 |
28 |
|
2.2.3 软件系统 |
28 |
|
2.2.4 Itanium64位计算介绍 |
28-30 |
|
2.3 国家973LSSC-Ⅱ万亿次机群系统(深腾1800) |
30-31 |
|
2.3.1 简介 |
30 |
|
2.3.2 硬件系统 |
30-31 |
|
2.3.3 软件系统 |
31 |
|
2.4 本章小节 |
31-33 |
|
第三章 机群系统NPB性能测试分析 |
33-49 |
|
3.1 NPB简介 |
33-35 |
|
3.2 NPB测试方法 |
35-36 |
|
3.3 机群系统性能对比测试分析 |
36-41 |
|
3.3.1 影响机群性能的两个主要因素 |
36-38 |
|
3.3.2 Deepcomp6800与Deepcomp1800T性能测试比较 |
38-39 |
|
3.3.3 Dawning4000A与Deepcomp6800性能测试比较 |
39-41 |
|
3.4 系统效率测试分析 |
41-43 |
|
3.5 可扩展性测试分析 |
43-47 |
|
3.6 本章小节及相关工作介绍 |
47-49 |
|
第四章 关联规则并行挖掘程序实现与性能分析 |
49-65 |
|
4.1 基于关联规则的并行数据挖掘 |
49-55 |
|
4.1.1 数据挖掘及关联规则挖掘 |
49-51 |
|
4.1.2 关联规则挖掘串行算法 |
51-53 |
|
4.1.3 关联规则挖掘并行算法 |
53-55 |
|
4.2 基于MPI的关联规则并行挖掘程序设计与实现 |
55-59 |
|
4.2.1 MPI简介 |
55-57 |
|
4.2.2 程序设计与实现中的关键问题 |
57-59 |
|
4.3 加速比测试及性能分析 |
59-64 |
|
4.3.1 性能测试 |
59-62 |
|
4.3.2 性能分析 |
62-64 |
|
4.4 本章小节 |
64-65 |
|
第五章 结论及未来工作 |
65-67 |
|
参考文献 |
67-73 |
|
硕士期间发表文章目录 |
73-75 |
|
致谢 |
75 |
|
| 【DOI】 | LunWen.ID:2.2008.363262 |