英伟达hopper架构的核心是什么?( 三 )
文章图片
文章图片
Hopper架构的H100的基于TMA的存储复制效率更高
05.
结语:GPU走向领域专用化
总体而言 , 基于Hopper架构的H100计算性能比Ampere架构的A100提高了大约6倍 。
性能大幅提升的核心原因在于引入FP8后的张量核心和针对NLP任务的Transformer引擎 , 特别是TMA技术减少了SM单元在数据复制时的无用功 。
从设计哲学上看 , 针对数据中心的Hopper架构中DSA(DomainSpecificArchitecture , 特定领域架构)的想法越来越多 , 且流多处理器间的协作变多 。大概老黄也觉得 , GPU应朝着领域专用化的方向去发展 。
今年发布Hopper架构相对Ampere架构有较多的微观进步 , 希望老黄下次能给我们带来更多的技术惊喜 。
参考文献:《NVIDIAH100TensorCoreGPUArchitecture》白皮书 , 英伟达;《GPGPU芯片设计:原理与实践》 , 陈巍、耿云川
- amd锐龙7000处理器爆料:16核型号tdp达到170w
- 技术突破延长寿命达45%,贝佐斯再押注对抗衰老,平民级应用还有多远
- 瞄准绿色新材料,助力“碳中和”——湖工大一项成果转化总金额达1703万元
- 比亚迪玩大的:与壳牌达成战略合作、车主充电不再发愁
- 幻塔拍摄艾达死士任务(幻塔拍摄艾达死士任务怎么做)
- 原神丘丘人诗歌交流顺序任务怎么过(原神丘丘人诗歌交流顺序任务达成指南)
- 长安汽车与海康机器人达成战略合作,共建工业AI联合创新中心
- 反诈达人集合啦!守护金币赢话费,3…2…1开始
- hopper架构大核心gh100架构图曝光
- 英伟达联合ibm打造“大加速器内存”