国家超级计算天津中心
新闻中心

HPC + AI + 物理模型:智能超算应用的新发展


智能超算为超算应用的发展提出了新的挑战和方向。如何融合传统的”HPC+物理模型”的计算模式与新的智能超算成为新的课题。2020年12月2日,国家超级计算天津中心邀请到了SC20戈登贝尔奖得主团队成员、中国科学院计算技术研究所贾伟乐副研究员,围绕主题“HPC + AI + 物理模型:智能超算应用的新发展”做了精彩的报告。

贾伟乐,中国科学院计算技术研究所副研究员,入选中科院百人计划,SC20戈登贝尔奖获奖人(一作)。2016年博士毕业于中国科学院大学(计算机网络信息中心),之后加入加州大学伯克利分校从事博士后研究工作,主要研究方向为高性能计算、第一性原理计算和人工智能交叉方向。在SC, Journal of Chemical Theory and Computation, Journal of Computational Physics, Computer Physics Communications,  Journal of Chemical Physics等发表多篇期刊会议论文。作为核心人员,参与了包括PWmat、LS3DF、PWDFT、PEXSI、DeePMD-kit等多个科学计算软件的研发。

第一性原理分子动力学(AIMD)的计算复杂度是与电子自由度的三次方。在材料计算领域,AIMD一般可计算的时空尺度为数百原子体系和皮秒量级。在过去的14年(2006年至2019年)中,世界上最快的超级计算机的峰值性能提高了约550倍(从Blue- Gene / L的360 TFLOPS达到Summit的200 PFLOPS),然而可模拟的物理体系仅增大了8倍(从具有12K价电子的一千钼原子到具有105K价电子的一万一千个镁原子),几乎完美符合立方尺度定律。线性扩展的计算方法在相关领域一直在积极研发中,但其计算复杂度前因子巨大,计算开销仍然很大,可模拟的时间空间尺度仍然很短。基于经验力场的MD方法可以很容易地模拟数百万甚至是数亿的原子,但其准确性达不到第一性原理精度,其他的一些力场方法如REAXXFF方法缺乏普适性。因此,亟需提出一种既保持AIMD模拟的准确性同时能提高模拟效率的方法。

优化后的DeePMD-kit的关键工作步骤(以水分子体系为例)

本报告从典型的科学计算出发,以第一性原理分子动力学为例,展示一种全新的” HPC + AI + 物理模型”的计算模式。该计算模式以智能超算为硬件基础,成功将人工智能算法与物理模型数据结合,其创新点主要包括以下几个部分:(1)对物理模型和关键数据结构进行优化,采用了深度势能(Deep Potential)方法拟合势函数;(2)优化了TensorFlow标准算子;(3)采用混合精度。在Summit超级计算机上首次实现了上亿原子的第一性原理分子动力学模拟,计算速度达到1纳秒/天。这比其他任何已知的第一性原理分子动力学模拟体系至少大100倍,计算速度至少快1000倍。最终DeePMD-kit在Summit全机上达到双精度91PFLOPS,混合单精度162PFLOPS,混合半精度274PFLOPS。分析显示:虽然DeePMD-kit达到了很好的性能,它仍是访存受限的应用,在混合半精度情况下尤其如此。这也为未来硬件设计提供了新的思路。

深度势方法示意图

国家超级计算天津中心成立于2009年,中心的“天河一号”超级计算机是首台获得世界第一的异构系统,目前正在联合国防科技大学研制百亿亿次超级计算。经过10多年的发展,中心积累了丰富的材料模拟计算经验,联合多家团队开展了多项材料AIMD模拟计算工作。尤其是在2018年7月获得了国家重点研发计划“材料基因工程关键技术与支撑平台重点专项”的支持,依托项目打造了中国材料基因工程高通量计算平台(http://mathtc.nscc-tj.cn),该平台支持材料的高通量、多尺度和自动流程计算,同时也可以利用该平台开展超大规模的材料模拟计算工作。

该报告中的工作与高通量材料计算平台结合将有效推动材料领域的产学研用协同发展,拓展我国新一代百亿亿次(E级)超级计算机的应用空间,为我国的材料基因工程研究和新材料的研发提供强大能力支撑。