国家超级计算天津中心

高性能计算(HPC)集群系统建设方案咨询与部署实施

服务内容

1) HPC综合方案咨询:

根据实际需求,提供HPC集群系统方案设计咨询服务,包括硬件选型、系统架构设计、服务架构设计、管理运维建议等。

2) 私有HPC集群部署实施:

提供私有化HPC集群的系统构建、服务平台定制部署、远程运维管理等服务。

3) HPC集群系统优化:

针对客户已有集群系统在运行过程中存在的问题进行优化升级、系统改造,协助客户以最小的成本投入解决集群系统的痛点问题。

4) HPC集群管理和运维培训:

总结分享大规模高性能计算集群系统在使用过程中存在的问题及解决思路,运维管理经验和安全防护策略,有助于客户对自己集群系统运维管理能力的提升。

服务价值

1) 使客户快速拥有私有的高性能计算集群。

2) 提升HPC集群系统管理水平和应用水平。

优势特点

1) 丰富的高性能集群运维管理和应用服务经验:

具有十年“天河一号”高性能集群系统部署、管理、运营经验,保障系统性能和稳定性,具有完备和规范的系统测试、监控、管理流程。天河-1A系统目前已累计运行作业总数超过1200万,日平均作业数超过8000个,同时在线作业数超过1400个,管理计算节点资源超过8000个,存储资源达4PB。

2) 丰富的高性能集群系统构建经验:

充分了解高性能集群系统架构,对应用的关键性能有较好的理解和把控,结合自主开发和开源的系统软件,在集群硬件及软件选型方面可有效的降低成本。使高性能集群系统运行更加稳定、安全、易于维护管理,在系统监控、用户管理、作业调度等方面具有较强的可靠性、可扩展性和灵活性,并可根据客户需求进行定制化开发。

应用场景

1) 自己没有但是需要私有的HPC集群

2) 自己有HPC集群但是运维管理和应用服务需要提高

服务对象

大型企业或集团、高校

成功案例

吕梁云计算中心:该中心部署了“天河二号”超级计算机,通过为其定制化开发部署HPC云,大大提高了用户体验和应用管理水平。