2021年第8期专题:国产复杂异构高性能数值软件的研制与测试
  • 分享:
  • 0

国产复杂异构高性能数值软件的研制与测试专题前言

孙家昶,  李会元
(中国科学院 软件研究所,北京  100190)
通讯作者: 孙家昶, E-mail: jiachang@iscas.ac.cn; 李会元, E-mail: huiyuan@iscas.ac.cn

中文引用格式: 孙家昶,李会元.国产复杂异构高性能数值软件的研制与测试专题前言.软件学报,2021,32(8):2287?2288. http://www.jos.org.cn/1000-9825/6009.htm

中国科学院首个C类战略性先导科技专项“国产安全可控先进计算系统研制”(419专项)主要目标已经达到.在数值软件层面,该专项第1阶段的主要任务是在国产复杂异构先进计算系统上研制高水平的基准测试软件HPL(high performance Linpack)与HPCG(high performance conjugate gradient). HPL与HPCG是国际上最受关注的用于评测高性能计算机浮点运算性能的两款基准测试软件.HPL通过高斯消去法求解稠密线性代数方程组来评测高性能计算机浮点性能的实际持续峰值,是目前全球超级计算机TOP 500以及中国高性能计算机TOP 100排行榜的依据.HPCG是求解稀疏代数方程组的一种迭代算法.HPCG基准测试在国际上受到广泛关注,与HPL相比,在一定程度上更能真实反映高性能计算机的实际应用性能.全球超级计算机TOP 500以及中国高性能计算机TOP 100均提供HPCG性能排行榜.如今,以计算速度为目标的HPL与HPCG基准测试,不仅为高性能计算机性能排名提供一种依据,更已成为一种被高性能计算提供商、研究机构与应用部门广为接受的工业标准.

419专项先后两次开展了HPL与HPCG基准测试.2019年5月在北京完成419专项曙光7000超级计算机基准测试,HPL与HPCG实测性能均一举超过全球超级计算机TOP 500排名第一的超级计算机Summit,成为事实上的卫冕之王.2019年11月在江苏昆山再次完成曙光7000超级计算机基准测试,HPL与HPCG实测性能分别达到TOP 500蝉联第一的Summit的1.68倍和2.06倍,其中,HPL效率超过65%,HPCG整机弱可扩展性并行效率达到93%.据此,419专项顺利通过中国高性能计算机性能TOP 100排行榜专家组的鉴定以及中国计算机协会专家组的肯定.

为此,《软件学报》编辑部特开设“国产复杂异构高性能数值软件的研制与测试”专题.专题拟聚焦国产复杂异构先进计算系统下的高性能计算软件、算法与测试技术,探讨软硬件总体结构与软件在先进计算系统中的地位与作用.专题定向邀请中科曙光、中国科学院计算技术研究所、中国科学院软件研究所、中国科学院计算机网络信息中心、中科海光等直接参与419专项的相关研究团队,从学术层面交流复杂异构系统下的高性能计算基础软件的研制和优化的各种关键技术,总结高性能计算软件和应用研究中的挑战与对策.内容重点涵盖先进计算系统基准评测软件HPL、HPCG等的研制、调优与测试及相应基础代数库BLAS/BLIS/ROCBLAS等软件库的优化,也包含了若干高性能应用算法与软件的研制进展.专题收到8篇投稿,先后邀请了十几位领域专家参与审稿,每篇稿件都由3位专家历经2轮或3轮审稿,最终有7篇论文入选本专题.

论文“异构HPL算法中CPU端高性能BLAS库优化”针对具体异构系统的体系结构以及HPL算法特点,利用多种技术手段优化CPU端调用的各级BLAS(basic linear algebra subprogram)函数,应用auto-tuning技术优化矩阵分块参数,从而形成了HygonBLIS算法库,以便更充分地利用通用CPU计算能力,提高系统整体效率.

论文“复杂异构计算系统HPL的优化”针对带有GPU的异构超级计算机系统,提出一套CPU与加速器计算任务分配方式,提出平衡点理论指导HPL性能优化,实现了加速器、CPU、网络等部件的高度并行,提高了加速器的利用率.

论文“国产异构系统上HPL的优化与分析”基于国产处理器-国产加速器异构系统提出了一个HPL性能模型,设计了一种多线程细粒度异构HPL算法,完成了一个轻量级跨平台异构加速框架HPCX,以实现跨平台的HPL算法.

论文“面向异构计算机平台的HPL方案”尝试为HPL的优化工作提供一种解决方案:Hetero-HPL.因为进程不再要求与(协)处理器一一对应,单节点HPL可以完全避免进程间数据传输开销、完全利用物理节点的所有 资源.

论文“国产异构系统上的HPCG并行算法及高效实现”面向某国产复杂异构超级计算机开展研究,提出了一种适用于结构化网格的图着色算法用于HPCG并行,提出一套更适用于HPCG的任务划分方法,并从稀疏矩阵存储格式、稀疏矩阵重排、访存等角度开展了细粒度的优化.

论文“SW26010众核任务并行调度系统及其嵌套并行算法应用”提出了支持任务嵌套并行模式的通用运行时框架SWAN,并基于SWAN框架在目标平台上实现了若干典型的具有递归特性的嵌套并行算法.

论文“面向异构计算的高性能计算算法与软件”对几类典型高性能计算应用软件开展并行计算算法特征分析,提炼出若干典型应用算法和软件的共性问题,并面向国产异构计算体系结构对高性能计算算法与软件进行了总结.

我们希望通过本专题的出版和传播,凝聚科技界及软件产业界对高性能计算基础软件和相应算法研究的重视,从而为后续国产异构计算机软件研制及产业发展打下更坚实的基础.

 

孙家昶(1942-),男,中国科学院软件研究所首席研究员,博士生导师,主要研究领域为科学与工程计算的方法、理论与应用,并行计算.

李会元(1973-),男,博士,中国科学院软件研究所研究员,博士生导师,主要研究领域为高性能计算,计算数学.

发布日期:2021-08-08浏览次数:

当期目录


文章目录

过刊浏览

年份

刊期

联系方式
  • 《软件学报 》
  • 主办单位:中国科学院软件研究所
                     中国计算机学会
  • 邮编:100190
  • 电话:010-62562563
  • 电子邮箱:jos@iscas.ac.cn
  • 网址:http://jos.org.cn/
  • 刊号:ISSN 1000-9825
  •           CN 11-2560/TP
  • 国内定价:70元
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号