继续狙击英伟达, AMD子弹已上膛丨焦点分析

继续狙击英伟达, AMD子弹已上膛丨焦点分析

作者丨邱晓芬
编辑丨苏建勋
10月10日 , 一年一度的Advancing AI大会上 , 美国芯片巨头AMD发布了一系列重磅的芯片产品更新 , 覆盖AI PC的处理器、EPYC处理器、DPU等等 。
在英伟达最新的Blackwell芯片面临交付困境的当下 , AMD最新的GPU产品系列(AMD Instinct MI325X)将如何出牌 , 直接关系到AMD的未来 , 自然成为各界的关注焦点 。
在参数上猛追英伟达 , 是AMD MI系列一以贯之的打法 , 此次的AMD Instinct MI325X芯片也不例外 , 选择紧密对标英伟达上一代芯片产品H200 。
不过 , 好消息是 , 从产品信息来看 , AMD如今逐渐找到了差异化竞争的策略——AMD这款产品逐渐把精力都放在了提升内存、推理能力上 。
AMD创始人苏姿丰发布AMD Instinct MI325X系列芯片
首先 , AMD Instinct MI325X上配备了256GB的HBM3E高带宽内存 , 提供了6TB/s的内存带宽——参数上比英伟达H200大许多(H200分别是141G、4.8TB/s) 。
其次 , 尽管AMD这款产品在FP16(16位浮点数)上的算力没有英伟达那么强 , 但推理能力却比英伟达H200整体高出20%-40% 。
重仓推理 , 不失为一项明智之举 。 一位行业人士向36氪表示 , 今年算力中心的一大趋势是 , 随着部分大模型厂商逐渐放下预训练 , 推理和模型微调的诉求增加 。
“某算力中心客户 , 去年预训练和推理的比例是7:3 , 今年完全反过来了” 。 下游大模型、应用厂商的需求变化 , 上游芯片厂商更需要及时做好策略转向 。
不过 , 只有单芯片的差异化竞争是远远不够的 。 AMD此次也从体系化入手 , 弥补在连接、软件生态上的短板 。 而这也正是英伟达的壁垒最高处 。
英伟达产品的一大优势是 , 依靠NV-Link , 使得多个单芯片连接起来之后依旧强大 , 不因芯片互联传递而折损算力 。 而此次 , AMD则依靠他们的Infinity Fabric互连技术 , 使得多卡的效果比单兵作战更强 。
据介绍 , 当8张AMD Instinct MI325X搭配在一起时 , 相比于同样数量级的英伟达(即H200 HGX) , 内存是其1.8倍、内存带宽是其1.3倍、算力更是其1.3倍 。
在软件生态方面 , AMD也持续补短板 。 AMD的软件平台ROCm通过持续调教、以及与多个AI开发平台深度合作 , 不仅不会拖后腿 , 反而提升了整体效率 。
经过AMD方面的实测 , 当跑Meta Llama-2模型时 , AMD MI325X单卡在ROCm的加持下 , 训练效率超过了英伟达H200 。 而若用AMD的8卡集群跑 , 训练效率仍也与H200 HGX相当 。
在此前的台北电脑展上 , AMD创始人苏姿丰已经明确 , GPU产品节奏向英伟达看齐 , 要“一年一更新” 。 AMD除了发布Instinct MI325X系列之外 , 也顺便透露了未来产品的情况——
据其介绍 , AMD下一代芯片Instinct MI350系列将在明年下半年推出 , 同样延续了这一代的产品逻辑 , 推理性能将有35倍提升、提供288GB的HBM3E内存 , 峰值算力提升1.8倍 , 与英伟达B200的算力持平 。
在逐渐明确了产品打法、发布节奏后 , AMD 2024年在数据中心领域大有高歌猛进趋势 。
苏姿丰此前透露 , AMD已经拿下了上百家AI客户和OEM厂商的订单 。 其在数据中心服务器的份额 , 也从早前可怜的个位数 , 上升到如今的30%左右 。
财报数据正是最好的说明 。 7月份 , AMD方面公布的信息显示 , 今年第二季度的数据中心业务收入达到了28亿美元 , 虽然相比于英伟达 , 数据还有很大差距(226亿美元) , 但同比大增115% , 也是AMD所有业务中增速最快的一项 。
AMD在数据中心领域的突围 , 其实是多项因素的综合作用——除了AMD上一代产品(MI300系列)找对了打法 , 成为AMD有史以来的爆款产品之外 , 还要叠加智算中心市场整体的大爆发 , 以及一丝对手失误的因素 。
在去年一整年 , 英伟达的GPU产品受困于产能 , 交货周期达到惊人的8-11个月 。 供应问题 , 直到2024年第一季度才有所缓解 , 但客户依旧需要等待漫长的3个月 。
而好景不长 , 当英伟达的H系列今年终于顺利进入出货高峰后 , 其最新的Blackwell系列芯片产品又陷入新一轮交付难题 。
综合多方信息显示 , 英伟达原定于今年三季度排产的全新Blackwell系列芯片 , 因为芯片设计缺陷 , 导致稳定性不足 , 又遇到供应链封装良率不高等原因 , 整体往后又推迟了一个季度 。
当对手持续受困于生产、设计难题 , AMD的产品自然成为弥补算力缺口的一项最佳选择 。
不过 , 英伟达也担心错失市场机遇 , 把蛋糕拱手让人 , 也在努力摆脱延期的阴霾 。
在AMD大会的同期 , 摩根士丹利为英伟达办了一场为期三天的非交易路演 。 路演上着重向投资人传递的信息是——Blackwell的难题已经解决 ,需求大热 , 英伟达“已经把未来一年内的芯片全部卖光” 。
黄仁勋此前也多次在公开场合暗示这一点 , 提示“这颗芯片正是每个客户都想拥有最多的产品 , 大家都想当第一个收到货的人” 。
对于AMD来说 , 这可能算不上是好消息 。 随着对手产能的阴霾散去 , 幸运的是 , AMD也逐渐找到适合自己的竞争节奏 。 2025年 , 两家芯片巨头 , 在GPU领域又再一次回归正面战场 , 这才是考验双方真正综合实力的关键一年 。
延伸阅读:
《AMD发布锐龙AI PRO 300 系列移动商用处理器 , 为AI PC“再添把火” | 最前线》
【继续狙击英伟达, AMD子弹已上膛丨焦点分析】end

    推荐阅读