成立十年,这家由中科院孵化的超算中心凭什么登上中国高性能计算机Top100榜单第三名?( 四 )


所以,无论是计算选址的确定,还是「超算 + 云服务」的互联网运营模式,都体现了北京超级云计算中心在计算供应中注重灵活与性价比的特点 。
从 A 分区所搭配的 CPU 来看,也可窥见北京超级云计算中心的商业运营理念:
A 分区采用的是 AMD 在 2019 年推出的第二代 EPYC(霄龙)服务级处理器,代号罗马(Rome),基于 7nm 工艺,搭载 64 核心 128 线程,在提升核心数量的同时也提升了时钟速度,加速频率可达 3.4GHz 。
从计算机的角度来看,计算总共可以分为 4 种类型:计算密集型、访存密集型、存储密集型(I/O 密集型)与网络通信密集型 。北京超级云计算中心的主要客户是访存密集型的应用,A 分区用户的特点是:计算规模不大,价格敏感 。而罗马处理器主频适中,计算性能适中,能耗低,性价比高,显然更有利于商业运营 。
郭宇坦言,北京超级云计算中心的目标并不是打造出像「神威 · 太湖之光」或「天河二号升级系统」这样各方面性能均衡又出色的超级计算机,而是找到自己的市场定位,为目标用户提供适合他们的超算方案 。
根据处理器的类别,北京超级云计算中心的超算分区可以划分为四大系列:
基于 AMD 芯片的 A 分区与 M 分区,以及 A 分区的加强版「A6 分区」
基于英特尔芯片的 T 分区与 L 分区
基于国产芯片的分区
基于英伟达芯片的 AI 智算云,比如 N17、N19 区
根据不同用户的需求,北京超级云计算中心设立了不同的分区去满足这些需求 。比如,荣登 2020 年中国高性能计算机 TOP100 榜单的 A 分区便是专门针对计算密集型与访存密集型的用户,存储性能加强的 I/O 分区专门面向 I/O 密集型用户等等 。
「中国科技云 · 超算云」汇聚了国家超算中心、互联网云计算中心等资源,可以为用户提供定制化的计算服务 。同时,他们揭开了高性能计算的「神秘面纱」,为用户提供运行问题解答、参数配置优化、定制化脚本编写等一系列服务,更有一对一专属微信群、7 × 24 小时人工值守与 5 分钟快速响应等机制 。
4
自主研发离不开计算
近年来,越来越多企业高举「自主研发」的旗帜 。与此同时,产品的迭代周期加快 。为了快速满足市场的需求,研发人员会越来越多地利用数字化技术进行模拟仿真,其间产生大量数据,对计算的需求也会越来越多 。
事实上,从 2010 年以来,许多企业也陆续建立了计算中心,但他们同样面临建设周期长、内部计算资源协调难、计算排长队的现象 。企业一般是基于项目的优先级进行计算资源的分配,但人工协调的效率较低,影响了研发项目的进展 。
郭宇认为,随着人们对云计算优势的认识加深,云计算的市场也在不断扩大 。在新基建中,「数据中心」对应的便是云计算,云计算是数字化转型的基础 。同时,随着「双碳」规划的推进,碳排放指标也将成为自建超算中心发展的限制因素之一 。而北京超级云计算中心在分布位置上的先见之明,无疑将在未来的逐鹿上优势渐显 。
作为国内第一家成规模的、市场化运营的超算中心,北京超级云计算中心的建设模式,启示了中国超算市场的发展现状:除了国家超算中心,越来越多由地方政府支持、市场化资本创办的超算中心展示了其在推进中国超算发展上的独特优势 。
比如,在 2020 年中国高性能计算机 TOP100 的榜单排名上,除了北京超级云计算中心 A 分区获得佳绩,内蒙古和林格尔新区的内蒙古高性能计算公共服务平台(青城之光)位居第四 。
除了尖端超算与通用超算,中国的超算市场还有一股重要的力量:公有云厂商,比如阿里云、华为云与亚马逊云(AWS) 。北京超级云计算中心的另一块重要业务——行业超算,便与这股力量有所交织与重叠 。