英伟达推理新品Rubin CPX前景生变,订单未下达或已被Groq技术取代
5月28日消息,据多位供应链及行业内部人士透露,英伟达(Nvidia)原计划于今年下半年发布的推理专用图形处理单元(GPU)——Rubin CPX,其发布前景正变得愈发不明朗。尽管该项目最初备受期待,但目前英伟达尚未向供应链下达相关内存或基板的订单,业内普遍猜测该项目可能已被实质性取消或进行了根本性的战略调整。
据知情人士透露,尽管英伟达早在去年9月的AI基础设施峰会上就公布了 Rubin CPX 的发布计划,并明确其将搭载8颗16GB的GDDR7显存(总容量128GB),采用板载部署设计,但截至目前,围绕该产品的实质性开发活动几乎处于停滞状态。
内存行业的相关人士表示,此前市场曾寄望于 Rubin CPX 能成为 GDDR7 显存从高端消费级显卡(如RTX 5090、RTX 5080)向更广泛AI服务器领域扩展的催化剂。然而,目前英伟达并未就 Rubin CPX 的 GDDR7 应用展开任何讨论,相关开发需求也未启动。虽然有猜测认为该产品可能改用高带宽内存(HBM),但目前同样没有取得任何进展。
基板行业的情况同样不容乐观。由于GDDR7内存被设计为围绕GPU基板的板载配置,基板厂商原本预期会迎来一波新的需求增长。但基板行业人士表示,由于 Rubin CPX 项目缺乏实质进展,业内普遍认为该项目实际上已被取消。
这一项目的生变并非毫无征兆。在今年3月举办的 GTC 2026 大会上,英伟达在展示其未来的 Vera Rubin 平台产品线时,意外地将 Rubin CPX 从产品路线图中移除。距离该公司首次展示该产品并计划于今年发布,仅仅过去了大约六个月。尽管外界对此变动多有询问,但英伟达方面至今未给出明确解释。
业内分析认为,Rubin CPX 项目的搁浅,很可能与英伟达在推理计算领域的战略重心转移有关。随着 AI 代理的普及,市场对推理计算的需求急剧增长,英伟达正在积极调整其产品布局以应对这一变化。
关键转折点出现在英伟达去年底与 Groq 签署的一项价值高达200亿美元的协议。通过该协议,英伟达不仅吸收了 Groq 关键的推理技术和工程人员,还获得了其语言处理单元(LPU)技术的授权。目前,Groq 的“Groq 3 LPX”已出人意料地成为了 Vera Rubin 平台的核心推理产品。
传统上,英伟达的 GPU 主要专注于 AI 训练工作负载,而 Rubin CPX 原本是为应对推理市场日益增长的需求而开发的专用 ASIC 芯片。然而,随着 Groq 技术的引入,英伟达显然找到了更具竞争力的替代方案。业内人士普遍认为,英伟达此举实际上是一次对 Groq 的“收购式”合作,旨在通过 LPU 技术巩固其在推理计算领域的领先地位。
目前,关于 Rubin CPX 的最终命运仍存在两种猜测。一种观点认为,鉴于英伟达已经确立了以 Groq 为中心的推理战略,Rubin CPX 项目可能已经被彻底放弃。另一种观点则认为,英伟达可能会在未来的 Feynman 产品线中,以完全不同的形式或规格重新设计并推出 Rubin CPX。
无论如何,Rubin CPX 当前的困境反映出 AI 硬件市场极其激烈的竞争与快速的技术迭代。对于供应链而言,原本预期的 GDDR7 市场扩张未能实现,短期内只能继续依赖高端消费级显卡作为主要出货渠道。