核聚变研究是当今世界科技界为解决人类未来能源问题而开展的重大国际合作计划。与不可再生能源和常规清洁能源不同,聚变能具有资源无限,不污染环境,不产生高放射性核废料等优点,是人类未来能源的主导形式之一。经过半个世纪的不懈努力,磁约束聚变研究仍然在最终解决人类能源问题的道路上艰难前进。影响达到点火目标的最关键问题是缺乏对托卡马克中高温等离子体极其复杂的非线性及动力学过程的基本了解,从而限制了对其有效控制的能力。磁约束聚变数值模拟是了解托卡马克中高温等离子体极其复杂的非线性及动力学过程的重要手段。
可提供聚变数值模拟方向的大规模数值计算服务:计算平台上已部署多个主流的聚变数值模拟领域的科学计算软件,如GTC、GTS、BOUT++等,中心工作人员可协助完成相关计算模拟任务,并协助用户分析应用程序热点和优化加速。
案例一:GTC代码开发与优化
磁约束聚变大规模数值模拟的重要软件“回旋环形等离子体代码”(Gyrokinetic Toroidal Code, GTC)是磁约束聚变领域的重要软件,主要用于研究磁约束溶解等离子体湍流传输问题。基于科技部ITER-CN专项“磁约束聚变大规模数值模拟与理论分析”,国家超级计算天津中心(以下简称天津超算中心)与北京大学、中国科学技术大学、浙江大学等科研院所共同合作开发GTC软件。天津超算中心主要负责GTC的CPU+GPU异构体系架构下的算法移植和开发优化工作,包括异构协同模型设计、异构并行程序开发等工作。
GTC在“天河一号”上实现了数万核量级的高度并行化,每秒模拟的电子数达到三百多亿,多项测试性能均超过了美国橡树岭国家实验室在超级计算机“美洲豹”(Jaguar)上运行同类程序的性能。经过对原有GTC程序进行CUDA移植和设计适合GPU上的并行算法,天津超算中心已经完成第一阶段的GPU开发工作,并进行了大规模测试(最大测试规模达3072结点),通过strong scaling和weak scaling下的多组测试表明,GPU版本的GTC程序具有良好的可扩展性,与原有程序相比也有2~3倍的加速。
图1 TH-1A上GTC weak scaling的性能测试
图1表示GTC在TH-1A上的weak scaling下的性能测试。节点数从64到3072,随着节点数的增加,每秒钟模拟的电子数基本是线性增加的,每秒最大模拟的电子数达到三百多亿。通过该图可以得出GTC程序在TH-A上有很好的可扩展性。
图2 TH-1A上GTC weak scaling的加速比
图2表示GTC在weak scaling下的加速比随结点数变化的情况。可以看出,在TH-1A上使用GPU进行的GTC程序的加速,在数万核级的大规模并行上也能取得1.5~2倍的加速。该实验进一步证实了在TH-1A上使用GPU进行大规模数值计算的优势。
基于以上研究成果,由孟祥飞、赵洋和朱小谦等人撰写的“Heterogeneous Programming and Optimization of Gyrokinetic Toroidal Code and Large-scale Performance Test on TH-1A”成功被ISC’13录用并做现场报告。国际超级计算机大会(International Supercomputing Conference,简称ISC)是世界超级计算机领域的顶级会议,是HPC领域全球历史最悠久、最盛大的技术研讨会之一。此次会议在世界范围内仅接收了35篇论文进行会议报告,天津超算中心的论文作者受邀到会议现场做论文报告。
案例二:磁约束等离子体微观不稳定性的演化
中国科技大学基于“天河三号”原型机使用了电磁全动理学模拟,模拟了真实参数的小型Tokamak装置(与CMod装置尺寸类似)电子-氘离子等离子体演化。模拟规模为192x64x256,每格128个采样点,总模拟时间步长为150万,大约模拟到2000个离子回旋周期(0.05ms)。
由于模拟的时间尺度跨越6个数量级,以往采用简化模型的方式,如磁流体与回旋动理学两种模型,都无法完整再现等离子体内部的全部物理过程,并且最终使用的离散格式无法保证长时间的守恒性质,故难以得到可靠的长期演化结果。首次通过电磁全动理学模拟,直接计算低频的磁约束等离子体微观不稳定性的演化,验证了在足够大规模的高性能计算机集群上直接采用保结构电磁全动理学模拟磁约束环型装置等离子体的可行性。