英伟达并非没有对手，英特尔发布最新AI芯片

2024-04-12 来源：贤集网

4422

4月9日，英特尔推出了其最新的人工智能芯片Gaudi 3。这家芯片制造商急于生产可以训练和部署大型AI模型的半导体，例如支持OpenAI的ChatGPT的模型。

新的 Gaudi 3 芯片的能效是英伟达前一代产品H100 GPU的两倍多，并且可以比H100 GPU 快一倍半。同时Gaudi 3 还有不同的配置，例如在一块主板上捆绑八个 Gaudi 3 芯片或可以插入现有系统的卡。

英特尔在Meta 的开源 Llama 和阿布扎比支持的 Falcon 等模型上测试了该芯片。Gaudi 3可以帮助训练或部署模型，包括Stable Diffusion或OpenAI的Whisper语音识别模型。

英特尔表示，其芯片使用的功率低于英伟达的芯片。

据估计，英伟达拥有80%的AI芯片市场，其图形处理器（GPU）在过去一年中一直是AI构建者的首选高端芯片。

新的Gaudi 3芯片将在第三季度向客户提供，包括惠普、超微等在内的公司将使用这些芯片构建系统。但是英特尔没有提供 Gaudi 3 的价格范围。

运行生成式 AI 和购买 Nvidia GPU 可能很昂贵，不少公司正在寻找其他供应商来帮助降低成本。除了性能、功耗外，Gaudi 3具有竞争力的价格、独特的开放式集成片上网络，正在使用行业标准的以太网。通过超级以太网联盟（UEC），英特尔正在引领面向 AI 架构的开放式以太网网络。该公司推出了一系列人工智能优化的以太网解决方案，包括AI NIC（网络接口卡）和人工智能连接小芯片。

随着云提供商和企业建立基础设施来部署人工智能软件，数据中心人工智能市场也有望增长，这表明即使英伟达继续制造绝大多数人工智能芯片，其他竞争对手仍有发展空间。

为减少对英伟达依赖，谷歌推出ARM服务器芯片

与微软、亚马逊一样，谷歌也推出了多款自研芯片，以减少对英伟达GPU芯片的依赖。

美东时间4月9日周二，谷歌在今年的年度云计算大会Cloud Next 2024上宣布推出一款基于Arm架构的数据中心芯片Google Axion，以及更新TPU v5p芯片。

谷歌表示表示，Google Axion处理器基于Arm Neoverse V2 CPU构建，以Titanium为基础，性能比通用ARM芯片高30%，而且比英特尔生产的当前一代 x86芯片高50%。预计Axion用于多种谷歌服务，并在“今年晚些时候”向公众开放。

谷歌云副总裁兼计算和机器学习基础设施总经理 Mark Lohmeyer 表示：“我们正在让客户轻松地将现有工作负载转移到 ARM。Axion 建立在开放基础之上，在任何地方使用ARM的客户都可以轻松采用 Axion，而无需重新架构或重新编写应用程序。”

“谷歌推出的新型 Axion CPU 标志着交付定制芯片的一个重要里程碑，该芯片针对谷歌的基础设施进行了优化，并构建在我们的高性能 Arm Neoverse V2 平台上。数十年的生态系统投资，再加上 Google 的持续创新和开源软件贡献，确保为在各地运行 Arm 的客户最重要的工作负载提供最佳体验。”Arm 首席执行官 Rene Haas表示。

事实上，Axion 只是众多定制发一份芯片中的最新产品。自2015年以来，谷歌已经发布了五代张量处理单元（TPU）；同时，2018年，谷歌发布了第一个视频编码单元 (VCU)，视频转码效率提高了33 倍；另外，2021年，谷歌通过投资“片上系统”(SoC) 设计，加大了定制计算的投入，并发布了用于移动设备的三代Tensor芯片中的第一款。

如今，谷歌推出新的芯片意味着，该公司正在追赶亚马逊和微软这些云领域竞争对手的步伐。亚马逊和微软2021年就已经推出Arm架构的CPU，作为提供差异化计算服务的一种方式。而谷歌之前为YouTube、AI及其智能手机推出过定制芯片，但还没有打造过CPU。

具体来说，Axion将适用于一系列任务，包括支持谷歌的搜索引擎和 AI 相关的工作。谷歌表示，该芯片可以通过帮助处理大量数据并为数十亿用户部署服务，在AI领域发挥重要的支持作用。同时，未来谷歌逐步转移到基于Arm云服务器用例上使用，Datadog、Elastic、OpenX 和 Snap都计划采用 Axion。

除了Axion之外，谷歌还宣布全面推出 TPU v5p，用于训练和推理的最强大、可扩展且灵活的 AI 加速器，其计算能力是上一代的 4 倍（400%）。

谷歌CEO桑达尔·皮查伊表示，生成式 AI的进步需要强大的底层基础设施。谷歌 AI 超级计算机结合了我们的 TPU、GPU、AI 软件等，为训练和服务模型提供性能和成本优势。如今，领先 AI 公司和 Google Cloud 客户（例如 Anthropic、AI21 Labs、Contextual AI、Essential AI 和 Mistral AI）正在使用其基础设施。

数据显示，虽然广告依然是谷歌最大收入源，但云计算的增长更快，在谷歌的收入中占比不断提高，已接近占公司总收入的11%。据Gartner估算，2022 年，谷歌占云基础设施市场 7.5% 的份额，而亚马逊和微软合计控制着 62% 左右的份额。

谷歌表示，现在已经有超过 90% 的 AI 独角兽企业在使用谷歌的计算资源、模型和开发环境。

如今，谷歌成为继微软和亚马逊之后，第三家用ARM架构推出数据中心CPU的科技巨头，这显示了新的趋势。而且，谷歌还利用TPU优势，全面提供服务器和数据中心闭环服务，降低英伟达、英特尔、AMD芯片的依赖。

有评论称，谷歌开发新芯片是在 AI 竞赛白热化之际减少对外部厂商的依赖。不过，谷歌的官员并没有将芯片新品视为一种竞争之举。谷歌负责自研芯片业务的副总Amin Vahdat说：“我觉得这是做大蛋糕的基础。”

大规模AI计算已经进入系统竞赛

在Intel Vision大会上，“生成式AI”这一主题可以说是贯穿全程，从数据中心的大规模AI训练与推理，到AI PC改变端侧生产力，英特尔正竭力展示自己作为先进芯片技术领导者的竞争力。

如今谈到大模型训练芯片，英伟达当仁不让是首选供应商，但这棵摇钱树早已被其他芯片大厂和创业新秀盯上，英特尔便是其中之一。英特尔正通过推出更具性价比的可扩展系统来打破这种一家独大的局面，这将为市场带来另一种选择。

大规模AI计算已经进入系统竞赛，无论是守擂者英伟达，还是英特尔、AMD、Cerebras、Groq等追击者，都明显加大对先进Chiplet封装、先进存储、先进互连技术的重视，通过从超越制程和reticle极限的芯片内部设计优化，到扩展至大型集群系统的技术升级，为整个数据中心的AI计算提供更高性能和能效的加速。

除了Gaudi 3，英特尔还在Intel Vision大会上分享了数据中心至强处理器和AI PC的进展，并现场连线远在英特尔晶圆厂的同事，演示如何在AI PC上用先进AI技术辅助芯片检测。

英特尔宣布面向数据中心、云和边缘的下一代处理器进行品牌焕新，即英特尔至强6。配备能效核的至强6（此前代号为Sierra Forest）将于2024年第二季度推出，配备性能核的至强6（此前代号为Granite Rapids）将紧随其后推出。

配备性能核的英特尔至强6包含了对MXFP4数据格式的软件支持，与使用FP16的第四代至强处理器相比，可将下一个token的延迟时间缩短至原来的15%，能运行700亿参数Llama-2模型。

英特尔预计将于今年出货4000万台AI PC，以及超过230种的设计，覆盖轻薄PC和游戏掌机设备。新一代英特尔酷睿Ultra客户端处理器家族（代号Lunar Lake）将于今年推出，具备超过100 TOPS平台算力，NPU算力超过46TOPS。

英伟达的“铁王座”还能做多久？

AI浪潮已经势不可挡，AI芯片作为其发展的底层基石也迎来了前所未有的机遇。据Gartner最新预测，到2024年AI芯片市场规模将较上一年增长25.6%，达671亿美元。预计到2027年，AI芯片市场规模将是2023年规模的两倍以上，达到1194亿美元。

在这样的背景下，“算力霸主”英伟达被捧上神坛，以高达80%的占有率几乎垄断了市场，赚得盆满钵满。英伟达数据中心业务的营收再创新高，带动2024年财年Q4季度总营收狂涨265%。由于这份远超预期的财报数据，英伟达一夜涨出2770亿美金市值，相当于：一夜涨出阿里巴巴+百度+京东。

英伟达的“狂飙”也引来了众多挑战者。亚马逊、谷歌、微软、华为、百度等巨头积极推动自研芯片，寒武纪、摩尔线程、燧原科技等新锐力量崛起。据外媒报道，英伟达在提交给美国证券交易委员会的文件中，其中包含AI芯片等多个类别里，首度将华为认定为“最大竞争对手”。

理想与狂热交织下，人们不免好奇：英伟达的“铁王座”还能坐多久？

登入后，方可留言>>

行业动态

DeepSeek全员扩招一倍！33个岗位全开，“不招天才”只要发光的人

存储通胀，端侧出货、定价被成本锁死，行业悖论发生了

OpenAI考虑将IPO计划延至2027年

热读文章

苗圩出席统筹推进疫情防控和产业转型升级促进制造业通信业稳定发展发布会

一图读懂2020年《政府工作报告》

工业富联：拟7763万美元收购鸿海精密美国子公司相关资产