央视“意外”曝光参数:平头哥PPU芯片超越英伟达A800
关键词: 华为昇腾 壁仞科技 国产卡与NV卡重要参数对比 阿里平头哥
在9月16日晚间,央视《新闻联播》在报道“中国联通三江源绿电智算中心项目建设成效”时,意外引发科技圈热议——画面背景中出现的一张“国产卡与NV卡重要参数对比”表格,首次高调展示了华为昇腾910B、壁仞科技104P等国产AI芯片在关键性能指标上对国际巨头英伟达的追赶与超越。
在李强总理甘肃、青海调研的新闻画面中,“国产卡与NV卡重要参数对比”表格成为国产算力芯片技术实力的有力证明。其中,阿里平头哥半导体有限公司推出的PPU(Parallel Processing Unit,并行处理器)芯片,凭借其卓越的性能参数,成为这场技术展示中的焦点。
平头哥PPU超越英伟达A800
据央视报道及后续多方信息证实,阿里平头哥的PPU芯片在关键技术指标上实现了对英伟达A800的超越。具体来看,平头哥PPU采用了96GB HBM2e显存,与英伟达H20的96GB HBM3容量持平(尽管H20采用更新一代的HBM3,技术领先),而英伟达A800的显存容量为80GB。
在片间带宽方面,PPU达到700GB/s,远超A800的400GB/s,接近H20的水平。部分报道甚至指出该数值为“900GB/s”,可能存在不同版本或测量标准差异,但普遍共识是PPU在互联带宽上实现了对A800的显著超越。
此外,PPU还支持更先进的PCIe 5.0接口,优于A800的PCIe 4.0,与H20保持一致。功耗控制在400W,与A800相当,但在能效比上表现出色,明显低于H20的550W。
简单来说,显存容量是算力卡的“数据仓库”,越大越能同时处理复杂AI任务;片间带宽是数据传输的“高速路”,越宽AI训练、推理速度越快;PCIe规格决定了算力卡与服务器的连接效率。
据《投资研究》公众号“壹号讲狮”援引云栖大会实测数据,平头哥PPU在Llama2-70B、GPT-3.5等主流大模型上的表现与英伟达H20互有胜负:
批尺寸为1时,首token延迟为82ms,优于H20的95ms;
批尺寸扩展至64时,PPU吞吐达2800 tokens/s,较H20提升约18%;
整机功耗仅350W,能效比领先30%以上。
更关键的是成本优势:得益于国内7nm工艺与2.5D封装,PPU单卡BOM成本较进口H20下降40%,推动阿里云公有云推理实例价格下降50%。
三江源智算中心签约,平头哥获最大算力订单
此次新闻联播报道的中国联通三江源绿电智算中心项目,是国产AI芯片规模化落地的重要案例。其于2024年8月17日正式揭牌,总投资约27.7亿元,旨在构建集约化、规模化、绿色化的智算综合园区,支撑“东数西算”战略需求。2024年3月,项目启动建设并分阶段实施。二期投资8.8亿元建设840架高功率服务器机柜,形成超10000P算力能力;三期于同年8月23日开工,规划984架机柜,算力规模达12000P以上。四期计划投资50亿元,联合头部企业打造绿电直供及算网协同的智算园区,目标总算力超20000P。
据《信创头条》报道,该项目已签约的国产算力部分总计1747台设备、22832张算力卡,总算力达3479P(PetaFLOPS)。其中:
阿里云签约1024台设备、16384张平头哥算力卡,总算力1945P,为所有品牌中最大订单;
中科院签约512台设备、4096张沐曦算力卡,算力984P;
北京京仪签约83台设备、1328张壁仞算力卡,算力450P;
中昊芯英签约128台设备,算力200P。
此外,拟签约项目算力达2002P,涉及太初元碁、燧原科技、摩尔线程等品牌。
公开资料获悉,平头哥半导体有限公司于 2018 年 9 月宣布成立,是阿里巴巴集团的全资半导体芯片业务主体。平头哥拥有端云一体全栈产品系列,涵盖数据中心芯片、IoT 芯片等,官方已列出的产品包括倚天 710、镇岳 510、含光 800、羽阵 600、羽阵 611。
其中,含光 800 是平头哥发布的首颗数据中心芯片,也是一颗高性能人工智能推理芯片,采用平头哥自研架构,基于 12nm 工艺,集成 170 亿晶体管,算力可达 820 TOPS。在业界标准的 ResNet-50 测试中,推理性能达到 78563 IPS,能效比达 500 IPS / W。
9月17日,截至发稿,阿里巴巴港股涨3.45%,报每股158.8港元,总市值重回3万亿港元。
未来展望
央视此次“意外”展示,标志着国产算力芯片已从“可用”迈向“好用”,正在“撕裂英伟达铁幕的一道关键裂缝”。平头哥PPU在显存、带宽、能效等关键指标上的突破,不仅打破了英伟达NVLink的互联垄断,也为国产大模型训练提供了更具性价比的替代方案。
尽管CUDA生态仍是巨大壁垒,但PPU通过软硬协同、场景优化和成本优势,正逐步构建自己的护城河。全国各地的国有算力枢纽被要求在芯片采购中有超过50%来自国内厂商,以支持本土半导体产业的发展。
之前据Bernstein最新报告指出,中国将在2025年投入910亿美元用于AI相关资本支出。其中,380亿美元将用于采购国产AI芯片,显现出国家层面强烈的本土化替代趋势。在2024年中国AI芯片市场中,Bernstein Research以销售金额口径统计,英伟达的市占率约为66%,华为海思约为23%,AMD约为5%,寒武纪、摩尔线程、沐曦股份约为1%。此次三江源项目的规模化签约,也表明国产AI芯片已获得国家级算力基础设施的认可。
此外,值得关注的是,国家市场监督管理总局在9月15日宣布对英伟达公司实施进一步调查,因其违反《中华人民共和国反垄断法》。这一举措无疑为国产算力芯片的发展提供了更为有利的市场环境。
