国家超级计算天津中心
新闻中心

天河新一代超级计算机应用成果报道—徐勇、段文晖研究组将深度学习电子结构计算方法推广到平面波基组


近日,清华大学物理系徐勇、段文晖研究组与美国加州大学伯克利分校物理系Steven G. Louie研究组合作开发了一套方法框架,将研究组开发的深度学习密度泛函理论哈密顿量(DeepH)方法从原先仅支持原子基组推广至适用于平面波基组,使得DeepH方法可与所有密度泛函理论(DFT)程序兼容。这给深度学习电子结构计算方法带来了更高的精度和更好的泛化能力,并打通了其利用电子结构大数据作深度学习的通道。研究成果以“Generalizing deep-learning electronic structure calculation to the plane-wave basis”为题发表于10月3日的《自然·计算科学》(Nature Computational Science) 杂志上。 

 

 

研究背景

 

近年来,深度学习与第一性原理电子结构计算的结合给大尺度量子材料的计算模拟以及新材料的发现带来了全新的机遇。在这一领域内,能够从材料原子结构直接预测DFT哈密顿量的DeepH方法取得了巨大的成功,在比传统DFT方法快多个数量级的速度下仍能保持亚毫电子伏的精度。这一方法已经被拓展至研究磁性、电声耦合等现象,可以支持杂化泛函,也可以实现非监督学习,近期还发展出了通用材料模型。然而,此类方法只支持局域原子轨道基组下的DFT程序,而完全不兼容使用平面波基组的DFT程序。事实上,平面波基组相对原子轨道基组有其独特的优势,如容易收敛、精度高、应用更广泛等,因此将DeepH方法推广至平面波基组对深度学习电子结构计算的未来发展具有重要的意义。

研究成果

 

在最新的研究中,为了解决这一问题,研究团队开发了一套高效且精确的方法,可以利用平面波DFT程序的计算结果重构原子轨道基组哈密顿量(图1),并构建了实现该功能的软件包H-PRO。针对不同材料体系的计算实验证明,由此方法得到的原子轨道基组哈密顿量不仅可以准确地重复出平面波方法计算得到的的电子结构信息,还能够直接适配原有的DeepH框架并训练得到准确的神经网络模型。由此,平面波基组下的深度学习电子结构计算问题得到了良好的解决,训练得到的神经网络也有更高的精度和泛化能力。不仅如此,研究团队还在由平面波DFT数据重构原子轨道基组哈密顿量的算法上有所突破,开发的基于实空间的方法能够比基于投影的传统算法快多个数量级,且对于材料体系大小有线性的时间复杂度。

 

图1:平面波基组下深度学习电子结构计算的示意图

 

a 平面波(PW)基组相对原子轨道(AO)基组有更高的精度和更广泛的应用,但深度学习电子结构计算方法往往只支持局域的原子轨道基组。研究中最新开发的方法可以利用平面波DFT计算结果重构原子基组哈密顿量,从而平面波DFT可与深度学习方法兼容。b 兼容平面波基组的深度学习电子结构计算方法的工作流程。首先在包含较小材料体系的数据集上进行平面波基组的DFT计算,然后由这些计算结果重构得到对应的原子轨道基组哈密顿量。在这些哈密顿量上训练的神经网络即可用于研究未知的大尺度材料体系。

 

目前,深度学习方法与电子结构计算正发生深度的融合,大数据与人工智能在互相驱动中共同发展,由两者共同推进的材料模拟与新材料发现正成为全新的材料科学研究范式。随着“材料大模型”概念的提出(进展报道:https://www.tsinghua.edu.cn/info/1175/112188.htm),人工智能的发展对高质量以及大规模的材料数据又提出了全新的需求。这一过程中,兼容平面波基组的深度学习电子结构计算方法将会变得不可或缺,因为这一方法能够直接对现有的材料大数据加以利用。目前绝大部分固体材料的DFT数据库都是使用平面波基组计算生成的,而且这些材料数据库仍然在不断地被扩充。可以期待,能够在这些大数据上进行训练的深度学习模型将会具有前所未有的潜力。在可以预见的未来,能够进行电子结构计算的人工智能必将日趋强大,而功能也将日趋完善。

 

清华大学物理系徐勇教授、段文晖教授以及加州大学伯克利分校物理系Steven G. Louie教授为该论文的通讯作者,清华大学物理系的访问学生(现为加州大学伯克利分校博士研究生)贡晓荀为第一作者。该工作在清华大学完成的部分得到了国家自然科学基金委基础科学研究中心、国家科技部重点研发计划、国家自然科学基金重点项目、国家杰出青年科学基金、北京市未来芯片技术高精尖创新中心、北京材料基因工程高精尖创新中心、国家超级计算天津中心等项目单位的支持。 

 

国家超级计算天津中心的天河新一代超级计算机为本研究提供了重要支撑,其超大规模的计算资源以及专业的技术团队极大地加快了研究进展。