成立十年,这家由中科院孵化的超算中心凭什么登上中国高性能计算机Top100榜单第三名?( 五 )


行业超算更注重实际业务,应用规模为单核到几千核不等,超算只是业务中的一环 。比方说,在基因测序的过程中,基因测序仪产生大量数据,这时候,如果数据存储在云上,使用云的存储、网络与计算资源等等服务进行基因的测序与分析,那么整个业务流程就会十分流畅 。
对于这类业务流程,郭宇认为,单靠通用超算是很难满足的 。从北京超级云计算中心的角度来看,他们会考虑将通用超算与云厂商的云服务资源相结合 。除了核心的计算业务,公有云厂商还提供丰富的云服务组件,能更好地解决用户的问题 。
「对用户来说,解决问题最重要 。至于计算资源来自哪里,他们并不在乎 。我们就是要把各种优势的资源组合在一起,满足客户的需求 。」郭宇谈道 。
从 2018 年至今,北京超级云计算中心已服务超过 15 万用户,已实现连续盈利 。
比如,北京超级云计算中心曾支持中科院力学所研究中速磁浮列车的空气动力学外形优化设计 。中速磁浮列车气动外形优化研究需要针对一系列优化外形进行数值模拟研究,对计算资源的要求较高,单工况网格量约 6000 万左右,流场特性研究及外形优化研究中产生的计算工况上百计 。
在这个项目中,北京超级云计算中心提供了可灵活拓展的大量计算节点,保证了多任务的提交计算 。最终,他们确定的最优化流线外形,相对于原始外形,头车气动升力系数增加了 33.25%,尾车气动升力系数减少了 1.78%,整车气动阻力系数减小了 4.44%,大幅提升了中速磁浮列车的气动性能 。
「从用户的角度看,建设几千核的计算资源,先不说时间,就投资成本来讲,现在的主流服务器,一个节点大概是 40 核心,如果他用的是 5000 核的计算资源,那么就需要 125 个节点,125 个节点大概需要投资1200多万,但他们的项目时长只有两个月 。」郭宇介绍 。
因此,从投入产出比来看,对一些短期的项目来说,直接采购计算资源显然更划算 。
5
计算紧跟时代
在郭宇看来,目前国内的超算市场展示了以下三个趋势:
趋势一:国内的企业越发重视自主研发,计算需求增加,同时也越来越愿意接受云计算的模式 。
趋势二:国产化的推进加深 。在超算体系中,芯片、操作系统、应用等等方面的国产化趋势将越来越明显 。
趋势三:计算体系架构正在革新 。随着人工智能、加速计算的兴起,以异构计算、加速卡为引导的 GPU 力量正在崛起 。
郭宇谈起,他在 2019 年去美国参加全球超级计算大会(SC19)时,席间与美国高校的老师聊天,得到的讯息便是:「在现在的环境下,如果你没有搞点 GPU 的加速计算,文章都难发 。从学术的角度看,CPU 体系已经研究地差不多,下一个重点就是 GPU 。」
2021 年正好是北京超级云计算中心成立的十周年 。作为一家商业化运营的超算中心,郭宇介绍:「我们肯定会坚定不移地走超算商业化的道路 。与此同时,他们也会与时俱进,根据国内超算市场的发展趋势,制定新的发展方针 。
紧跟学术界的研究趋势,北京超级云计算中心也加大了在 GPU 计算领域的投入,建设基于 GPU 加速卡的计算分区 。随着人工智能计算的兴起,以及异构计算模式的变化,他们也顺势建立了「AI智算云」,以满足部分从事人工智能研究学者的需求 。
相应地,针对企业的自主研发需求,北京超级云计算中心也逐步推出了一系列面向企业的计算资源,比如针对 CAD 三维设计和中小规模 CAE 仿真计算的设计仿真云,支持海量中小企业实现 " 云上研发 ",可以极低成本起步,推动中小企业高速发展,为国家中小企业发展打造坚实云上研发平台 。针对超算体系国产化的趋势,他们也有了基于国产芯片的集群,与国产软件厂商合作,通过云化的方式,帮助国产应用更好地触及用户 。