英伟达的gpu技术壁垒有多高?

GPU硬件结构精密复杂 , 是长期技术演进的结果 。高级图形处理步骤较多 , 包括顶点处理、光栅化、纹理贴图等步骤 , 给予支持的是底层精密复杂的硬件结构 。以2018年英伟达推出的Turing架构为例 , 其包含4608个CUDACore(普通运算单元 , 包含1个INT32单元和1个FP32单元) , 576个TensorCore(深度学习矩阵运算单元) , 72个RTCore(光追单元)等细微构成 , 相互协同工作 。英伟达硬件架构每两年升级一次 , 从英伟达2010年正式推出第一个完整的GPU计算架构Fermi以来 , 已经迭代5次 , 每一次都是对硬件的升级与改进 。
算法与生态是GPU的软实力 。GPU图形渲染需要用到计算图形学 , 计算图形学是一门复杂的学科 , 涉及数学、物理等多种知识 。模拟真实世界是十分困难的 , 树叶抖动、头发丝被风吹起、水波荡漾这样看似平常的场景 , 在计算机上实现的背后是大量的图形算法 。软件生态是GPU厂商的重要竞争屏障 。一方面 , 英伟达与行业伙伴形成商业合作或者互相授权;另一方面 , 英伟达推出供软件开发人员使用的CUDA平台 , 形成开发人员社区生态 , 截至2020年 , CUDA已经成为全球高级图形处理和AI计算的权威 , 影响力堪比IOS , 助力英伟达成为全球GPU龙头 。
图形处理比AI计算技术壁垒更高 。功能上 , 图形处理和AI计算本质上都是并行计算 , 但是图形处理多了图形处理相关模块 , AI计算可以比作图形处理的“删减版” 。算法上 , 图形处理算法涉及模拟真实物理世界 , 需要考虑物理、数学等多种问题 。GPU比FPGA和ASIC技术更难 。功能上 , GPU兼具图形显示与AI计算 , 性能更强 。算力上 , GPU内核算力更强 , GPU做图形渲染需要双浮点精度 , 而仅用于AI计算的FPGA和ASIC最多只需要单浮点精度 。
Intel二十多年多次研发GPU , 仍未成功 。英特尔最早的GPU研发可以追溯到1997年 , 英特尔通过收购C&;T获得了2D显示核心技术 , 3D技术源于拥有20%股权的Real3D 。1998年 , 依靠Real3D的技术 , 英特尔推出了第一款独立GPUi740 , 但后续因为研发结果不理想等原因 , Intel未再继续研发独立GPU 。2007年 , 看到英伟达开启GPGPU战略、推出CUDA , 英特尔为保持优势 , 计划重新推出独立GPU产品Larrabee , 但由于研发进度不及预期、性能不佳等原因 , Intel于2010年5月宣布取消独立GPU研发计划 。2020年 , Intel又推出了全新的独立GPU架构Xe , 但直到2021年10月 , Intel仍未推出自己消费级的独立GPU产品 。
GPU技术壁垒极高 , 国产化之路道阻且长 。GPU设计是一项系统工程 , 包含硬件架构、算法、软件生态等多个组成 , 缺一不可 , 壁垒极高 , CPU巨头Intel近二十年多次尝试踏足高端GPU领域 , 皆未成功 。相对于FPGA和ASIC , 不论是从功能上 , 还是硬件上 , GPU设计难度都更高 。GPU的自主研发之路是艰难且漫长的 , 由于没有像ARM一样的第三方IP授权厂商 , GPU设计商必须完全自主研发 , 从零做起 , 难度较大 。
去年底 , 本土高端IP和芯片定制企业芯动科技发布了国内首款国产高性能4K级显卡GPU芯片——“风华1号” , 基于芯动自主研发的全套高端IP , 风华1号可以说首次实现了高性能、全国产 , ”是一颗“真正”的高端国产GPU芯片 。芯动科技也被盛赞为“中国版的英伟达” 。
英伟达的gpu技术壁垒有多高?
文章图片

文章图片

作为中国一站式IP和芯片定制及GPU领军企业 , 芯动科技16年来已为各国产半导体代工厂和300家全球知名客户提供顶尖IP和芯片定制 , 协助了包括瑞芯微、君正、微软、AMD、亚马逊等知名公司各种芯片量产 , 而且所有技术自研可控 , 能持续迭代 , 不断超越 。逾50亿颗先进SoC芯片成功推向市场的背后 , 比如大家每天用的轨道交通身份证识别和全球顶级示波器 , 都有用到芯动科技的IP技术 。不仅如此 , 芯动科技还是TSMC2021全球研讨会认可的唯一大陆合作伙伴 , 技术和量产积累十分深厚 。在为各合作伙伴提供IP和芯片定制期间 , 芯动科技积累了GPU所需要的全套高端IP、图形芯片内核定制技术和先进工艺经验 , 形成了从工艺到设计 , 到器件 , 到量产 , 到封装 , 到整机的完整芯片设计验证条流程 。这为“风华1号”GPU芯片的研发奠定了稳固的基础 。