国家超级计算天津中心
新闻中心

天河新一代超级计算机应用成果报道——天文数据处理程序开发及优化


射电天文推动着宇宙学、星系演化、生命起源等重要科学探究的发展,射电天文数据处理工作流中最重要且对计算性能要求最高的步骤是网格化(Gridding),用于将采样空间中分布不均匀的观测数据映射到均匀分布的网格中,从而实现天文成图,为后续科学分析提供基础。射电天文数据的网格化任务具有“高复杂度、负载多样及多通道负载”的特性,使得在算法设计时需要综合考虑“硬件计算环境选择、数据结构设计、计算资源的分配和使用、任务的并行化及调度”等多个技术层面,以实现高效、稳定、可扩展的计算。

 

伴随着高灵敏度、高分辨率、更大观测范围的大型射电观测设备的不断兴建,如我国自主建造的世界上最大的单天线射电望远镜FAST(Five-hundred-meter Aperture Spherical radio Telescope),使得射电天文观测的数据量呈指数级增长,射电天文也由此步入了海量天文数据的时代。例如在基于 FAST 的多科学目标同时巡天项目 CRAFTS(Commensal Radio Astronomy FAST Survey)中,根据 FAST 65,536数量的不同频段覆盖范围的频谱通道、190MB/s 的数据收集速率,针对完整观测大约 440 天的观测周期以及其他观测参数推测, FAST 每年大概产生10-20 PB 的观测数据。为此,当前的射电天文学研究迫切需要对大规模的观测数据实现快速、高性能的网格化计算。

 

图一 中国天眼射电望远镜 FAST

 

图二 FAST 19 波束接收机及FAST巡天扫描策略示意图

 

天津大学于策教授团队的王昊工程师和卢豫工程师,与国家超级计算天津中心的郑刚工程师组成开发团队,基于天河新一代超级计算机,以FAST射电望远镜的高通量谱线数据网格化为应用背景,从高性能计算的角度对射电天文数据网格化这一科学问题进行了系统性的研究,设计实现了面向天河新一代超级计算机的网格化程序HCGrid-YH。该程序提出了三层分层架构设计,实现了节点并行+加速簇+加速阵列三层网格化并行算法:

 

(1)在HDF5数据处理层,HDF5提供MPI并行读写实现多通道谱线数据并行处理,如图三所示:

图三 HCGrid-YH 多通道谱线数据处理示意图

 

(2)在节点内使用 CPU+HTHREAD+SIMD 的并行计算算法实现加速阵列的并行处理。例如,在单加速簇内实现了HTHREAD多线程在map size 为5°×5°,采样点的数据规模为10^6,输出网格cell为900×900时,图四分析了HCGrid-YH单个Cluster性能的多核可扩展性。从图中我们可以看出,HCGrid-YH在单个Cluster下表现出了非常好的多核可扩展性,当线程组的线程数量为24时,相比较于核数为1的计算时间,获得了20.4倍的性能加速。

图五 HCGrid-YH的加速比

 

网格化算法HCGrid-YH的成功移植与优化,验证了我国自主研发的天河新一代超级计算机算硬件计算环境及异构编程模型的易用性和通用性,该程序已经在超大规模中性氢巡天数据处理方面开展广泛应用,能够为宇宙学、暗物质与暗能量等领域的科学研究提供有效支撑。

 

同时,基于该成果撰写的论文“A method for effcient radio astronomical data gridding on multi-core vector processor”、“EasyNUSC: An Efficient Heterogeneous Computing Framework for Non-uniform Sampling Two-dimensional Convolution Applications”以及“A large-scale heterogeneous computing framework for non‑uniform sampling two-dimensional convolution applications”已分别在国际期刊Parallel Computing、国际会议Proceedings of the 22nd International Conference on Algorithms and Architectures for Parallel Processing (ICA3PP 2022)以及国际期刊CCF Transactions on High Performance Computing (CCF THPC 2023)上发表。

 

注1:国家超级计算天津中心积极探索在天文宇宙学等领域的发展,与国家天文台在内的重点科研单位均建立了深远的合作关系,在资源服务、项目合作、科学研究和工程化探索等方面获得业内认可。

注2:500米口径球面射电望远镜(英语:Five-hundred-meter Aperture Spherical radio Telescope,简称FAST)又被称为“中国天眼”,是中国科学院国家天文台的一座射电望远镜,FAST主体工程于2011年开工,2016年落成;是目前世界第一大的填充口径(即全口径均有反射面的)射电望远镜;若不局限于球面无线电望远镜,则是仅次于俄罗斯RATAN-600环状射电望远镜的世界第二大的单一口径射电望远镜。