英伟达hopper架构的核心是什么?( 三 )


英伟达hopper架构的核心是什么?
文章图片

文章图片

Hopper架构的H100的基于TMA的存储复制效率更高
05.
结语:GPU走向领域专用化
总体而言 , 基于Hopper架构的H100计算性能比Ampere架构的A100提高了大约6倍 。
性能大幅提升的核心原因在于引入FP8后的张量核心和针对NLP任务的Transformer引擎 , 特别是TMA技术减少了SM单元在数据复制时的无用功 。
从设计哲学上看 , 针对数据中心的Hopper架构中DSA(DomainSpecificArchitecture , 特定领域架构)的想法越来越多 , 且流多处理器间的协作变多 。大概老黄也觉得 , GPU应朝着领域专用化的方向去发展 。
今年发布Hopper架构相对Ampere架构有较多的微观进步 , 希望老黄下次能给我们带来更多的技术惊喜 。
参考文献:《NVIDIAH100TensorCoreGPUArchitecture》白皮书 , 英伟达;《GPGPU芯片设计:原理与实践》 , 陈巍、耿云川