欢迎访问深圳市中小企业公共服务平台电子信息窗口

传英伟达取消四芯粒版Rubin Ultra改用双GPU设计,网友质疑被做空

2026-07-01 来源:电子工程专辑
65

关键词: 英伟达 Rubin Ultra 双GPU CoWoS-L HBM4E SemiAnalysis

7月1日消息,半导体研究机构SemiAnalysis在X平台披露,英伟达下一代旗舰AI芯片Rubin Ultra的原始设计因封装制造难题被迫大幅缩水。该机构称,原版采用四颗计算芯粒的Rubin Ultra在GTC 2026发布约三个月后即遭取消,新版改为双芯片设计,尺寸规模缩减至原来的一半,实际性能也随之减半。

此帖迅速引发热议,但多名网友质疑该消息为三个月前的旧闻,并指责SemiAnalysis立场偏颇,刻意"做空"英伟达。

原版设计取消原因

要理解这次"缩水"的份量,需先看原版设计的野心。据TechPowerUp此前报道,标准版Rubin GPU采用2颗计算芯片加8个HBM4内存模块的封装方案,而原版Rubin Ultra计划将其翻倍——4颗计算芯片加16个HBM4E内存模块,全部集成在单一封装内,单封装内存容量高达1TB,预计2027年推出。这相当于把两块完整的Rubin芯片"拼"进一个封装,对先进封装技术的要求极高。

据SemiAnalysis及Global Semi Research披露,英伟达与台积电原计划采用CoWoS-L封装工艺将四颗接近光罩尺寸上限的大芯片集成在单一封装内。但在4芯片(2+2排列)的配置下,封装基板出现严重翘曲问题——基板向多个方向弯曲,导致计算芯片无法与底层基板完全接触,接触不良意味着信号传输失效,芯片根本无法正常工作。

面对这一难题,台积电正在探索一种名为CoPoS(Chip-on-Panel-on-Substrate,面板上芯片基板封装)的新方案,核心思路是用大尺寸方形或矩形面板替代硅中介层,以容纳更多芯片和HBM内存。但问题在于时间:台积电原计划最早2026年建立CoPoS试验线,量产目标在2028年底至2029年上半年,这与Rubin Ultra原定的2027年发布时间表存在明显错位,赶不上节点。

新版方案:双芯片+8组HBM4E,HBM需求同步缩减

在制造执行层面的严峻挑战下,英伟达最终决定放弃四芯片方案,转向双芯片设计。新版Rubin Ultra单个封装内的HBM模块数量从16组缩减至8组。SemiAnalysis评估指出,新版双芯片Rubin Ultra的尺寸规模约为原版的一半,实际性能也将随之减半。不过该机构强调,这一减半估算基于计算单元与内存接口的等比例缩减,并非英伟达官方确认的性能数据,英伟达仍可能通过架构优化在新方案中尽可能获得更多性能。

SemiAnalysis的自我矛盾

颇具戏剧性的是,SemiAnalysis在6月30日同日发布了两份方向截然相反的判断。

"冰"的一面是上述Rubin Ultra缩水的利空消息。该机构进一步指出,英伟达市场份额正受到亚马逊Trainium、谷歌TPU及AMD芯片的侵蚀,"制造执行层面的问题只会让更多市场份额流失"。该机构还称,最成功的AI智能体Claude Code,其推理工作有相当大一部分运行在Trainium上,而Claude的训练则在TPU上完成,"就在一年前,TPU和Trainium能增长得如此之快,同时CUDA护城河被缓慢侵蚀,这还是难以想象的事"。

"火"的一面则是对英伟达业绩的乐观上修。SemiAnalysis同日发布的Accelerator Model预测显示,英伟达2027财年下半年数据中心计算业务收入将较华尔街一致预期高出约19.7%,核心支撑在于此前制约Rubin平台大规模出货的HBM4内存供应问题已告解决,前端晶圆产能储备到位,为下半年业绩爆发扫清了障碍。

网友质疑:三个月前的旧闻,立场偏颇

SemiAnalysis的帖子在X平台引发了两极反应。

质疑方认为这不过是翻炒旧闻。多位网友表示,"这是三个月前的旧闻","Jukan在三月份就分享了这个信息,4芯片版本被取消是众所周知的事"。有网友直接批评:"SemiAnalysis又发了一篇反英伟达的文章,这次是关于4芯片取消的误导性报道。

更有意思的是——SA的全部公信力建立在供应商中立的立场上,而不是充当AMD和ASIC的代言人。"

还有网友称,"SemiAnalysis显然已做空英伟达,很可能是在模仿Leopold的对冲仓位。"

支持方则认为此事值得关注,有网友评论:"英伟达正在自身的傲慢中崩塌。"

英伟达方面未就上述报道发表评论。有网友称,"英伟达一如既往地对这些不停歇的FUD传言保持沉默。"

或对HBM行业产生影响 

若四芯片方案确实取消,对产业链将产生连锁影响。在HBM内存端,原方案预计配备16组HBM4E模块,新版仅使用8组,HBM需求预期相应下调。在客户端,由于英伟达当前更侧重销售机架级解决方案(如液冷Kyber机架级系统)而非单独GPU产品,单颗GPU成本下降未必转化为客户整体支出的降低——若客户需要购买更多系统来获得同等规模的算力,整体支出可能不降反升。