mcm封装技术的重要性在哪里?

近些年 , GPU在业界的重要性愈加凸出 , 无论是在高性能计算 , 还是在消费级领域 , 其对用户的粘性越来越强 , 英伟达的火爆就是得益于其核心的GPU技术和产品 , 在这种情况下 , 传统巨头英特尔坐不住了 , 原本只是在消费级市场生产集成GPU显卡 , 市场需求的变化使得英特尔开始组建独立GPU研发团队 , 并投入了越来越多的资源 , 以应对英伟达和AMD的竞争 , 特别是在高性能计算领域 。
在高性能应用领域 , 对GPU的功耗和成本可控的要求越来越高 , 这就对相关技术提出了更高的要求 , 包括芯片设计方法、EDA工具、制程工艺 , 以及封装技术 , 要想实现高性能与功耗、成本的有效平衡 , 以上这些技术环节缺一不可 , 而随着摩尔定律的逐步“失效” , 先进封装技术的重要性越来越凸出 , 而英特尔、AMD和英伟达这三巨头都看到了这一环节的重要性 , 并不断加强研发力度 。特别是在近期 , 这三家公司不约而同地在MCM(多芯片模块)方面披露了重要信息 。
MCM打入GPU
MCM是为解决单一芯片集成度低和功能不够完善的问题而生的 , 它把多个高集成度、高性能、高可靠性的die , 在高密度多层互联基板上用SMD技术组成多种多样的电子模块系统 , 形成多芯片模块 。MCM具有以下特点:封装延迟时间缩小 , 易于实现模块高速化;缩小整机/模块的封装尺寸和重量;系统可靠性大大提高 。
以前 , MCM主要用于CPU和存储设备 , 特别是在CPU领域应用较为普遍 , 如早期IBM的Power4双核处理器 , 就是4块双核Power4以及附加的L3高速缓存形成的MCM , 还有英特尔的PentiumD(研发代号:Presler)、Xeon , 以及AMD的Zen2架构Ryzen(核心代号:Matisse)、EPYC处理器等 , 都是应用MCM的典型代表 。
近些年 , 在AMD的引领下 , MCM封装技术开始走向GPU 。之所以如此 , 主要是因为传统显卡是带有多个GPU的PCB板卡 , 需要连接两个独立显卡的Crossfire或SLI桥接器 。传统的SLI和CrossFire需要PCIe总线来交换数据、纹理、同步等 。由于GPU之间的渲染时间会产生同步问题 , 因此在许多情况下 , 传统的双GPU显卡 , 即单个PCB上的两个芯片由它互连 , 每个芯片都有自己的VRAM 。SLI或CrossFire的能耗很大 , 冷却也是一个挑战 , 这些在很长一段时间内都困扰着工程师 。
MCMGPU则是一个单独的封装 , 其板载桥接器取代了传统两个独立显卡之间的Crossfire或SLI桥接器 。
在高性能计算应用领域 , 这种MCMGPU的优势很明显 , 也值得花费更多时间和精力在解决封装和互连方面的软件问题 , 以应对更高的MCM设计复杂度 。目前来看 , MCMGPU主要用于数据中心和云计算应用领域 。随着技术的不断成熟 , 以及PC应用性能的提升 , 其在消费电子领域的应用也将会出现 。
三巨头发力
最早将MCM封装技术引入GPU的是AMD 。2020年 , 该公司把游戏卡与专业卡的GPU架构分家了 , 游戏卡的架构是RDNA , 而专业卡的架构叫做CDNA , 首款产品是InstinctMI100系列 。2021年 , AMD的Q2财报确认CDNA2GPU已经向客户发货了 , 其GPU核心代号是Aldebaran , 它成为AMD第一款采用MCM封装的产品 , 是为数据中心准备的 。在PC方面 , 2022年引入下一代RDNA3架构后 , 基于MCM的消费级RadeonGPU也会出现 。
制造多芯片计算GPU类似于制造多核MCMCPU , 例如Ryzen5000或Threadripper处理器 。首先 , 将芯片靠得更近可以提高计算效率 。AMD的Infinity架构确保了高性能互连 , 有望使两个芯片的效率接近一个的 。其次 , 使用先进的工艺技术批量生产多个小芯片比大芯片更容易 , 因为小芯片通常缺陷较少 , 因此比大芯片的产量更好 。