探访成都智算中心:算力“底座”里的四川“智造”

本文转自:四川日报
探访成都智算中心:算力“底座”里的四川“智造”
文章图片

文章图片

成都智算中心航拍图 。受访者供图
探访成都智算中心:算力“底座”里的四川“智造”
文章图片

文章图片

成都智算中心智算平台机房内部 。四川日报全媒体采访人员 吴忧 摄
近日 , 成都智算中心正式上线 , 一批应用投入运营 。作为“东数西算”国家一体化大数据中心成渝枢纽节点的样板工程 , 成都智算中心是西南地区最大的人工智能计算中心 , 也是强大的算力“底座” , 首期提供总计300P的人工智能算力 , 相当于15万台高性能个人计算机的算力 。
强大算力从何而来?算力“底座”如何搭建?近日 , 采访人员走进成都智算中心的核心区域探“底” 。
基础平台叫“天宫” 从处理器到系统都是自主造
在成都智算中心人工智能算力平台的机房 , 排列齐整的机柜透着蓝光 , 机柜里的服务器指示灯交替闪烁 , 片刻未息 。
“首期300P的算力 , 利用率已超过90% , 可以说上线就是饱和运营 。”负责项目运营的智算云腾(成都)科技有限公司智算项目经理王富红介绍 , 目前这里的算力正在为多个项目提供支撑 。这些强大的算力 , 正是源于眼前的机柜和机柜里的服务器 。
采访人员注意到 , 在每台机柜侧面 , 都有一个红色的“天宫”标识——这是成都智算中心的核心基础设施 , 全称是“天宫”昇腾AI全栈基础软硬件平台 。
“取名‘天宫’ , 凸显自主创新 。”四川华鲲振宇智能科技有限责任公司(以下简称“华鲲振宇”)是成都智算中心的承建方 , 也是这些“天宫”的供应商 , 该公司常务副总裁、首席战略官刘东告诉采访人员 , 这个基础平台从处理器到系统都是自主打造 , “实现了全国产化 , 自主可控、安全可靠 。”
硬件方面 , “天宫”基于昇腾处理器开发 , 后者是国产自研人工智能处理器 , 具备高算力、高能效的特点 。软件方面 , 成都智算中心所采用的基础软件 , 以及算力服务管理平台、第三方AI平台、深度学习运营管理平台等 , 也是自主搭建而成 。
“从后端的运行控制 , 到前端的用户交流界面 , 都是从头定制 。”华鲲振宇成都智算中心项目技术负责人龙昌伟告诉采访人员 , 与通用算力不同 , 智算中心主要负责人工智能领域的计算 , 而成都智算中心聚焦节能增效、降低延迟 , 按照存储和计算一体、训练和推理一体来建设 , 此前几乎没有先例可循 , “自主开发的全新软件 , 针对性更强、效率更高 , 更能确保智算中心安全稳定运行 。”搭建过程像搭积木 模块化机房7天完成堆叠
“天宫”造好 , 还需点亮 。在成都智算中心 , 人工智能算力平台从开工建设到上线点亮只用了120天 , 核心机房的搭建只用了短短7天 。如此快速的背后 , 是一种全新的建设方式 。
“我们称之为‘乐高式’快速堆叠 。”龙昌伟介绍 , 成都智算中心的建设采用预制模块化、钢构和土建三种方案一体推进 , 是国内首个采用这种方式建设的样板工程 。具体来说 , 整个机房被拆分为65个模块化的箱体 , 全部提前在工厂完成预制 , 再通过吊装的方式在现场进行快速堆叠 , 最后进行调试 。
“30天完成工程预制 , 两天进行运输 , 7天完成现场吊装 , 然后用60天完成内部安装调试和验收 。”龙昌伟说 , 依靠这种施工方式 , 整个机房一站式交付 , 让建设工期缩短了50%以上 , “通过这样的模块化设计 , 还能提升运维效率 , 并保证以后可以按需部署、按需扩容 , 实现快速升级 。”