阿里平头哥高端AI芯片“真武810E”来了
阿里巴巴旗下半导体公司平头哥(T-Head)在其官网正式发布了高端AI芯片“真武810E”(Zhenwu 810E)。这款芯片的亮相并非简单的产品更新,它标志着阿里巴巴内部酝酿已久的AI“黄金三角”——由通义实验室(大模型)、阿里云(云基础设施)和平头哥(芯片)组成的“通云哥”战略体系首次完整浮出水面。借此,阿里巴巴已初步构筑起“芯片+大模型+云计算”的全栈自研能力,被业界称为“中国版谷歌”。

从“新闻联播”曝光到正式亮相
“真武810E”对于行业而言并非完全陌生的面孔。早在2025年9月,央视《新闻联播》在报道中国联通三江源绿电智算中心项目时,其画面中就曾短暂曝光过一款代号为“PPU”的芯片及其关键参数,引发了业界对阿里自研AI芯片进展的广泛猜测。
如今,这款神秘的芯片终于以“真武810E”的正式身份登场,证实了阿里巴巴在高端AI芯片领域长达数年的潜心研发已进入商业化应用阶段。
平头哥官网指出,“真武810E”是一款实现了从硬件架构到配套软件栈全栈自研的AI芯片。“平头哥自主研发的AI产品软件栈,拥有独立知识产权,具备统一的编程接口,可端到端支持用户自主业务落地和扩展。”
高效性:通过软件栈提供的API,用户可以基于SDK直接开发真武应用程序,支持自研生态
高兼容性:沿用当今主流编程环境,开发者可调用软件栈中统一的API,支持主流AI生态,无需修改应用代码平头哥AI产品软件栈具备完备的软件生态及工具链,向上支持开发者和业务快速展开,向下兼容底层硬件和优化性能,实现软硬件高效协同。
关键参数曝光:已实现万卡集群部署
根据官方信息及此前曝光的数据,“真武810E”在多项关键性能指标上瞄准了国际主流产品。该芯片采用自研的并行计算架构和名为ICN(Inter-Chip-Network)的片间互联技术。在硬件配置上,单卡配备了高达96GB的HBM2e高带宽内存,支持PCIe 5.0 ×16主机接口,功耗控制在400W以内。

尤为引人注目的是其互联能力。每颗“真武810E”芯片集成了7个独立的ICN链路,片间互联带宽最高可达700GB/s。极高的互联带宽是实现多卡、多机协同计算,支撑千亿乃至万亿参数大模型训练的关键。平头哥官方表示,凭借这一特性,芯片可以灵活配置多卡组合,在集群中实现优异的线性加速比。
在性能对标上,多方报道指出,“真武810E”的综合性能已超过英伟达此前为中国市场推出的“特供版”产品A800,部分关键参数与英伟达另一款产品H20相当。例如,其96GB的显存容量与H20持平,但采用的HBM2e内存规格略低于H20的HBM3;其700GB/s的片间带宽则介于A800和H20之间。
“真武810E”并非停留在纸面发布。它已经历了大规模实际应用的验证。该芯片目前已在阿里云上实现了多个万卡集群的规模化部署,系统稳定运行,服务于超400家头部企业客户。这些客户涵盖国家电网、中国科学院、小鹏汽车、新浪微博等行业巨头,芯片支撑着包括大规模深度学习训练与推理在内的复杂AI任务。阿里巴巴自家的千问(Qwen)大模型的训练与推理任务,也已在“真武810E”上运行。

“通云哥”闭环成形,阿里的AI超级计算机愿景
“真武810E”的发布,其意义远超单一芯片产品。它被认为是阿里巴巴“通云哥”AI战略闭环的最后一块拼图。通义实验室负责前沿大模型研发(“通”),阿里云提供强大的算力输出与平台服务(“云”),平头哥则打造最底层的算力硬件基石(“哥”)。三者协同,旨在实现从底层芯片、中间层云平台到顶层模型架构的垂直整合与协同创新。
这种全栈自研的模式,使阿里巴巴能够更高效地进行软硬件协同优化,针对自身的大模型和云业务需求定制算力, potentially 提升能效比并降低成本。有分析指出,阿里巴巴正意图将“通云哥”打造为一台统一的AI超级计算机,以更系统化的方式参与全球AI竞赛。
长期以来,平头哥的芯片首要任务是满足阿里巴巴集团内部的算力需求。然而,“真武810E”的成熟与大规模外部客户验证,标志着平头哥正从集团的“成本中心”向具有市场竞争力的独立业务实体迈进。报道显示,平头哥正在积极推动芯片业务走向更广阔的市场,并已有独立的资本运作和上市计划。
回顾平头哥的发展历程,自2018年成立以来,其产品线已从早期的AI推理芯片含光800,扩展到Arm服务器CPU倚天710、高性能SSD主控芯片镇岳510,以及如今的训推一体AI加速芯片“真武810E”,形成了覆盖数据中心、IoT等场景的端云一体产品体系。