国家超级计算天津中心
新闻中心

CNMGE平台新进展:集成ALKEMIE加速新材料研发与设计


随着数据化和智能化时代的到来,科学的发展模式经历了经验主导的第一范式、物理理论主导的第二范式和计算模拟主导的第三范式,而今正处于数据驱动的第四范式。材料研发模式也正在由“Edison Style”的试错-纠错模式向“Hollywood Style”的智能模式转变。

材料设计研发智能模式即基于海量材料数据库,通过元素周期表快速筛选出符合预期的新材料,然后智能计算和分析化合物的材料性质,最终快速获得具备目标性质的新材料体系。传统的材料研发模式往往需要经过漫长的试错和纠错过程,而材料设计研发智能模式可以加快新材料研发的周期,降低新材料研发的成本。因此,发展高通量自动流程材料集成计算算法与数据管理智能平台变得至关重要。

依托国家重点研发计划“材料基因工程关键技术与支撑平台重点专项”,国家超级计算天津中心等十家单位打造了中国材料基因工程高通量计算平台CNMGE(The High-Throughput Computational Platform of Chinese Materials Genome Engineering)(http://mathtc.nscc-tj.cn),该平台已在线上面向用户运行。

近期在其上集成了北京航空航天大学孙志梅教授团队于2017年基于python开源框架自主开发的一套高通量自动流程可视化集成计算和数据管理智能平台ALKEMIE (Artificial Learning and Knowledge Enhanced Materials Informatics Engineering)。用户注册登陆CNMGE平台后,在web端即可免费体验使用ALKEMIE。

 

CNMGE平台集成的ALKEMIE展示

ALKEMIE包含了适用于数据驱动的材料研发模式的三个核心方面:材料高通量自动计算模拟、材料数据库及数据管理、基于人工智能和机器学习的材料数据挖掘技术。它主要由三部分组成:ALKEMIE Matter Studio (MS)、ALKEMIE Data Vault (DV) 和ALKEMIE Potential Mind (PM)。

ALKEMIE主要包含以下特征,如下图所示:

LKEMIE可视化高通量自动流程计算和数据管理智能平台主要功能和特点

高通量:ALKEMIE可以管理单用户超过104数量级的高通量计算任务;

自动化:该平台的高通量工作流从建模、计算到数据分析全程自动运行无需人工干预,运行过程可以采用默认参数,也可自定义参数;

可视化:该平台基于QT设计了用户友好的可视化界面,使得高通量内部的工作流程和数据传递方式更加透明,操作更加便捷,方便具有不同材料知识背景的用户使用;

工作流:该平台开发设计了适用于多种计算软件的科学工作流。

数据库:构建了多种类型的材料数据库,包括材料结构数据库、工作流数据库、材料性质数据库、文件数据库、适用于机器学习的结构描述符数据库等。

机器学习:该平台基于scikit-learn、PyTorch和TensorFlow等多种通用的机器学习工具开发了适用于材料结构能量预测、原子受力预测和带隙预测的模型,并为模型的进一步开发和应用定制了统一的底层接口。

插件模式:该平台支持以插件模式集成添加不同功能的计算模块,目前已添加多个不同尺度的计算软件,包含第一性原理计算软件VASP、OpenMX,分子动力学软件Lammps、ASE,热力学计算软件Gibbs和OpenCalphd以及相场计算软件OpenPhase等,其中部分软件仅提供算例功能,未来将进一步完善丰富。

本次CNMGE平台与ALKEMIE平台之间的深入合作,是材料基因工程专项内跨项目、跨领域的交叉合作的典型示范案例。未来,CNMGE平台团队将做好底层技术支撑和推广运营,ALKEMIE平台团队将做好科学研究和专业开发,双方共同建立起精诚合作、优势互补的合作模式,天津超算中心将继续推广这种合作模式,与更多的材料模拟计算团队合作,共同促进和推动中国材料基因工程的发展。

国家超级计算天津中心项目团队在材料基因平台开发过程中逐渐形成了一整套完整的对材料软件平台快速集成研发的支撑能力,建立起了一支跨材料、计算机领域交叉融合的研发团队,能够有效的对材料基因专项软件平台类项目提供技术服务和底层支撑。CNMGE平台是一个国家级的开源开放平台,平台实现了高并发、跨尺度、自动流程的高通量材料计算模拟和材料计算数据管理。

下一步,国家超级计算天津中心即将推出CNMGE平台开放研究基金,通过提供免费机时,鼓励用户使用CNMGE平台来加快新材料的研发速度和降低研发成本,同时也鼓励用户共享材料软件和数据等成果,欢迎大家联系我们并申请使用CNMGE平台。