用全球最快 AI 超算秀肌肉后,黄仁勋要用 AI 抓住元宇宙( 二 )


NVLink技术未来将会被广泛应用与NVIDIA的芯片中 , 包括CPU、GPU、DPU以及SoC , 凭借此技术 , 英伟达的用户们将能够利用英伟达的平台实现芯片的半定制化构建 。
EoS全球最快的AI超算
算力不够 , 数量来凑 。
通过黄仁勋的讲解我们可以得知 , 8个H100和4个NVLink可以组合成DGXH100 , 这个巨型GPU拥有6400亿晶体管 , AI算力32petaFLOPS;32台DGXH100又能组成一台具有256块GPU的DGXPOD;而将18个DGXPOD , 共4608个GPU搭建在一起 , 则是英伟达此次宣布的EoS超算 。
用全球最快 AI 超算秀肌肉后,黄仁勋要用 AI 抓住元宇宙
文章图片

文章图片

DGXH100|英伟达
最终EoS能达到的算力 , 以传统超算标准看是275petaFLOPS , 将是此前基于A100的美国最大超算Summit的1.4倍;以AI计算的角度看 , EoS输出18.4Exaflops , 将是当今全球第一超算富岳的四倍 。
届时 , EoS将是世界上最快的AI超级计算机 。
02软件:稳步更新
在软件系统方面 , 英伟达依旧稳步更新 。
此次英伟达发布了60几项针对CUDA-X的一系列库、工具和技术的更新 , 并介绍了自己在气候预测、对话式AI服务Riva以及推荐系统Merlin框架方面的进展 。
用全球最快 AI 超算秀肌肉后,黄仁勋要用 AI 抓住元宇宙
文章图片

文章图片

Earth-2|英伟达
去年的GTC2021上 , 英伟达发布了首台AI数字孪生超级计算机Earth-2 , 几个月过去 , 英伟达基于此开发了一个天气预报AI模型FourCastNet 。
【用全球最快 AI 超算秀肌肉后,黄仁勋要用 AI 抓住元宇宙】这一模型由英伟达与来自加州理工学院、伯克利实验室等高校及科研机构的研究员们共同开发 , 通过对高达10TB的地球系统数据进行训练 , 预测降水概率的准确率比以往的模型更高 。
随后 , 黄仁勋又介绍了英伟达的对话式AI服务Riva 。
Riva2.0版本支持识别7种语言 , 可将神经文本转换为不同性别发声的语音 , 用户可通过其TAO迁移学习工具包进行自定义调优 。
Maxine是一个包含30个AI模型的工具包 , 可以实时优化视频通信的视听效果 。
用全球最快 AI 超算秀肌肉后,黄仁勋要用 AI 抓住元宇宙
文章图片

文章图片

Maxine|英伟达
当远程视频会议召开时 , 即便你在读稿或者浏览其他网页 , Maxine可以帮助说话者与参会的其他人员保持视线上的交流 。如果参会人员包含不同国籍、使用不同语言 , Maxine能够通过AI模型实时切换成另一国语言 。
Merlin框架面向的则是推荐系统 。
它可以使企业快速构建、部署和扩展先进的AI推荐系统 。黄仁勋在直播中以微信举例 , 使用Merlin后微信的短视频推荐延迟被缩短为原来的四分之一 , 吞吐量提升了10倍 , 从CPU迁移至GPU , 腾讯在该业务上的成本减少了二分之一 。
03元宇宙与新一轮AI浪潮
在提升算力、补齐CPU短板的同时 , 英伟达也没忘记自己最终追求的元宇宙的「星辰大海」 。
黄仁勋的虚拟形象ToyJensen又一次上场与本尊进行对话 , 而值得注意的是 , 这一次的ToyJensen能够做到完全实时地与黄仁勋进行眼神交流与对话 。
面对「什么是合成生物学」、「你是如何制作出来的」等刁钻问题 , ToyJensen都给出了流畅的回答 。
ToyJensen的背后是英伟达的OmniverseAvatar框架 , 该框架能使企业快速构建出类似的虚拟形象 , 无论是外表、动作还是声音能都模仿得惟妙惟肖 。
而实时对话这一点则是由上文提到的Riva以及超大语言模型Megatron530BNLP提供的技术支撑 , 虚拟形象由此可以听懂问题并实时回复 。