用全球最快 AI 超算秀肌肉后，黄仁勋要用 AI 抓住元宇宙( 二 ) 「下一个时代的AI」

NVLink技术未来将会被广泛应用与NVIDIA的芯片中，包括CPU、GPU、DPU以及SoC ，凭借此技术，英伟达的用户们将能够利用英伟达的平台实现芯片的半定制化构建。
EoS全球最快的AI超算
算力不够，数量来凑。
通过黄仁勋的讲解我们可以得知， 8个H100和4个NVLink可以组合成DGXH100 ，这个巨型GPU拥有6400亿晶体管， AI算力32petaFLOPS；32台DGXH100又能组成一台具有256块GPU的DGXPOD；而将18个DGXPOD ，共4608个GPU搭建在一起，则是英伟达此次宣布的EoS超算。

文章图片

文章图片

DGXH100|英伟达
最终EoS能达到的算力，以传统超算标准看是275petaFLOPS ，将是此前基于A100的美国最大超算Summit的1.4倍；以AI计算的角度看， EoS输出18.4Exaflops ，将是当今全球第一超算富岳的四倍。
届时， EoS将是世界上最快的AI超级计算机。
02软件：稳步更新
在软件系统方面，英伟达依旧稳步更新。
此次英伟达发布了60几项针对CUDA-X的一系列库、工具和技术的更新，并介绍了自己在气候预测、对话式AI服务Riva以及推荐系统Merlin框架方面的进展。

文章图片

文章图片

Earth-2|英伟达
去年的GTC2021上，英伟达发布了首台AI数字孪生超级计算机Earth-2 ，几个月过去，英伟达基于此开发了一个天气预报AI模型FourCastNet 。
【用全球最快 AI 超算秀肌肉后，黄仁勋要用 AI 抓住元宇宙】这一模型由英伟达与来自加州理工学院、伯克利实验室等高校及科研机构的研究员们共同开发，通过对高达10TB的地球系统数据进行训练，预测降水概率的准确率比以往的模型更高。
随后，黄仁勋又介绍了英伟达的对话式AI服务Riva 。
Riva2.0版本支持识别7种语言，可将神经文本转换为不同性别发声的语音，用户可通过其TAO迁移学习工具包进行自定义调优。
Maxine是一个包含30个AI模型的工具包，可以实时优化视频通信的视听效果。

文章图片

文章图片

Maxine|英伟达
当远程视频会议召开时，即便你在读稿或者浏览其他网页， Maxine可以帮助说话者与参会的其他人员保持视线上的交流。如果参会人员包含不同国籍、使用不同语言， Maxine能够通过AI模型实时切换成另一国语言。
Merlin框架面向的则是推荐系统。
它可以使企业快速构建、部署和扩展先进的AI推荐系统。黄仁勋在直播中以微信举例，使用Merlin后微信的短视频推荐延迟被缩短为原来的四分之一，吞吐量提升了10倍，从CPU迁移至GPU ，腾讯在该业务上的成本减少了二分之一。
03元宇宙与新一轮AI浪潮
在提升算力、补齐CPU短板的同时，英伟达也没忘记自己最终追求的元宇宙的「星辰大海」。
黄仁勋的虚拟形象ToyJensen又一次上场与本尊进行对话，而值得注意的是，这一次的ToyJensen能够做到完全实时地与黄仁勋进行眼神交流与对话。
面对「什么是合成生物学」、「你是如何制作出来的」等刁钻问题， ToyJensen都给出了流畅的回答。
ToyJensen的背后是英伟达的OmniverseAvatar框架，该框架能使企业快速构建出类似的虚拟形象，无论是外表、动作还是声音能都模仿得惟妙惟肖。
而实时对话这一点则是由上文提到的Riva以及超大语言模型Megatron530BNLP提供的技术支撑，虚拟形象由此可以听懂问题并实时回复。