欢迎访问深圳市中小企业公共服务平台电子信息窗口
AI芯片红利实在太诱人,科技巨头们能威胁英伟达的地位吗?
2024-04-15 来源:贤集网
986

关键词: AI芯片 台积电 英伟达

科技巨头谷歌、Meta、英特尔纷纷推出最新款AI芯片,全力追赶英伟达,本轮AI竞赛愈发激烈。


Meta:官宣下一代AI训练与推理芯片项目(MTIA)

4月10日消息,Meta Platforms宣布推出其训练与推理加速器项目(MTIA)的最新版本。据悉,MTIA是Meta专门为AI工作负载设计的定制芯片系列,Meta的目标是通过一系列产品迭代降低对英伟达等公司的依赖。

据Meta介绍,新一代AI芯片由台积电代工,采用5纳米工艺制程。MTIA也是该公司更广泛产品开发的一部分,针对Meta独特的工作负载和系统进行了优化。与前一个版本相比,新的MTIA在计算能力和内存带宽上都提高了一倍多,有助于强化内容排名和推荐广告模型。

去年10月,Meta表示,将在支持AI的基础设施上投入多达350亿美元,包括数据中心和硬件。首席执行官扎克伯格表示,到2024年,AI将成为Meta最大的投资领域。近日Meta表示,该公司不仅要投资于计算芯片,还要投资于内存带宽、网络、容量以及其他下一代硬件系统。


谷歌:推出Arm架构AI芯片Axion

4月9日,谷歌谷歌宣布推出了为数据中心设计的、基于Arm架构定制的新型CPU“谷歌Axion”,以期降低云计算的运营成本,并表示其性能优于x86芯片以及云端通用Arm芯片。

根据谷歌云内部数据显示,与通用Arm芯片相比,Axion提供的实例性能高出了30%;而与当代基于x86的同类处理器相比,Axion的性能高出50%,能效高出60%。预计这款芯片将于今年晚些时候上市。通过推出基于Arm的定制芯片,谷歌也希望能让其云计算业务更加经济适用,以此来和亚马逊以及微软竞争。

官方数据显示,谷歌母公司目前Alphabet有四分之三的收入来自广告,但其云计算部门的增长很快,已占到总收入的11%。


英特尔:发布新一代AI芯片Gaudi 3 AI加速卡

4月9日,英特尔在 Vision 2024 客户和合作伙伴大会上正式宣布推出最新的芯片产品 Gaudi 3 AI加速卡。

据悉,Gaudi系列是英特尔在2022年5月面向人工智能应用场景专门推出的芯片品牌,用以对标英伟达的人工智能计算芯片。英特尔表示,Gaudi 3 芯片的能源效率是英伟达H100型号GPU的两倍多,而运行速度是H100的1.5倍,预计该芯片将在今年第三季度推出。

官方资料显示,英特尔Gaudi 3采用5nm工艺,带宽是前代Gaudi 2(7nm工艺)的1.5倍,BF16功率是其4倍。Gaudi 3配备最高128GB的HBM2e内存,峰值带宽为 3.7TB/s。

在该活动现场,英特尔还围绕人工智能面向企业发布了处理器Xeon 6以及AI 开发开放平台计划等产品和方案。英特尔一直致力于通过力推AI在个人电脑终端的落地来反向促进自家上游硬件生态的繁荣。去年9月,英特尔首席执行官帕特·基辛格首次提出AI PC这一概念。当时,基辛格指出AI将通过云与PC紧密协作,进而从根本上改变、重塑和重构PC体验,释放人们的生产力和创造力。


英伟达真的危险了吗?黄仁勋:依然很稳

那么,前有谷歌、微软、亚马逊“造芯”,后有英特尔“弯道超车”,英伟达真的危险了吗?

2023年12月初,AMD高调推出了MI300系列产品。据介绍,MI300X芯片拥有超过1500亿个晶体管,内存密度是目前英伟达H100的2.4倍,内存带宽是其1.6倍。AMD首席执行官苏姿丰称,这款新芯片在训练 AI 软件的能力方面与英伟达的H100相当,并且在推理方面表现得更好,不过这一说法也未得到独立验证。

今年3月底,英伟达正式发布了新一代人工智能计算芯片B200。英伟达CEO黄仁勋表示,B200 GPU的AI运算性能在FP8及新的FP6上都可达20 petaflops,是前一代H100运算性能的2.5倍。

如今,随着Gaudi 3的正式发布,当前AI芯片市场呈现出英伟达B200、AMD MI300系列和英特尔Gaudi 3"三巨头"竞争的格局。英伟达在AI芯片领域"一家独大"的局面面临来自另外两家厂商的挑战。

不过,从黄仁勋角度来看,英伟达的生态系统很稳定,在当前AI算力"军备竞赛"中,英伟达依旧暂时是市场的佼佼者。

黄仁勋前段时间这段话其实表达的非常明确:“数据中心需要你运营它。购买和销售芯片的人考虑的是芯片价格。运营数据中心的人考虑的是成本,我们总拥有成本(TCO)非常好。即使竞争对手芯片是免费的,他们也不如我们,客户也不会买。我们的目标是增加更多的价值。但这背后需要很多努力,我们必须不断创新、我们不能把任何事情视为理所当然、我们有很多竞争对手。”

事实上,AI 芯片是一个不断向前“奔跑”的高技术行业。它没有垄断,只有不断创新提供更大价值,才有可能让企业持续保持领先地位。因此,无论是英伟达还是英特尔,他们都有非常强大的市场竞争力,也都有望成为 AI 加速计算市场的“领先者”。

如今,在服务器市场,AMD正在逐渐蚕食该公司的市场份额。据市场调研机构Mercury Research所公布的2023年第四季度AMD处理器市场份额统计数据,AMD EPYC已经拿下了23.1%服务器市场份额,份额占比再次扩大。尽管EPYC作为通用处理器,算力上不如GPU加速器,不过该产品可与GPU加速器、AI加速器等协同工作,实现效率的最大化。

而全新英特尔 AI 芯片Gaudi,预计将不太会在中国大陆市场销售。但从全球来看,它是否真的能如其所言的,凭借性能优势、极具竞争力定价优势而占领更大的市场份额,一切还有待时间的检测。


无芯片,不AI

AI芯片是AI算力的核心。

有说法称,对标ChatGPT,做好一个大模型的最低门槛就是1万块A100的芯片。前面说到,随着人工智能应用场景和数据规模的扩大,算法模型的复杂度呈指数级增长,特别是深度学习成为主流,需要更快的计算速度。虽然CPU可以执行AI算法,但由于内部逻辑多,对于AI算法来说效率不高。因此,出现了专门的AI芯片,它们设计用于高效并行计算,加速AI计算过程,并提高性价比。

广义而言,AI 芯片指的是专门用于处理人工智能应用中大量计算任务的模块,除了以 GPU、FPGA、ASIC 为代表的 AI 加速芯片,还有比较前沿性的研究,例如:类脑芯片、可重构通用 AI 芯片等。狭义的 AI 芯片指的是针对人工智能算法做了特殊加速设计的芯片。

这里面,GPU是AI芯片主力军,因为它拥有卓越的高性能计算能力和通用性,适用于处理复杂算法和通用型人工智能平台。而随着人工智能技术、平台和终端的不断成熟,随着视觉、语音、深度学习的算法在FPGA以及ASIC芯片上的不断优化,此两者也有望逐步占有更多的市场份额。

根据VMR数据,全球和中国的GPU市场规模预计将继续快速增长。2021年全球GPU市场规模达到334.7亿美元,预计到2030年将增至4773.7亿美元,年复合增长率达34.4%。2020年中国GPU市场规模为47.39亿美元,预计到2027年将增至345.57亿美元,年复合增长率为32.8%。这表明GPU在人工智能领域的需求将继续扩大,并将成为市场的重要推动力量。


寻找中国版英伟达,期待国产替代空间

对于AI在下一轮科技革命中的地位,各国已经形成共识,都在纷纷抢滩。从中美对比来说,竞争优势的争夺就主要涉及前面提到的算法、大数据资源和算力三方面。在算法设计方面,双方没有明显差距,主要依赖设计团队的智慧和灵感;在大数据资源方面,中国占据着绝对优势,双方在大数据分析技术上相近。然而,决定人工智能产品的关键要素还包括“算力",计算能力是计算机的核心能力,这也是中美两国长期竞争超级计算机领域的原因之一。国内大模型与国外的主要差距也体现在算力层面,没有算力基础,后面算法等发展都无法进行。

在AI芯片领域,国外的芯片巨头占据了大部分市场份额,有着明显的先发优势,比如英伟达、AMD、英特尔的营收几乎代表整个GPU行业收入。而国内的AI芯片产业起步较晚,与世界先进水平存在较大差距,国内AI芯片市场也较为分散,集中度较低,发展空间巨大。

不过,国内一批新兴力量正在崛起,竞争梯队越发丰富。从国内AI芯片厂商格局来看,以大算力或者高性能计算芯片为代表,一梯队,有成熟产品、批量出货的企业,主要包括寒武纪、华为海思、百度昆仑芯、燧原科技,这四家有2-3代更多的产品,技术能力、软件能力都有一定积累;二梯队,主要包括以AI芯片起家的壁仞科技、天数智心、摩尔线程、沐曦等。壁仞科技去年发布的产品规格很高,但主要还停留在纸面数据,实测数据、实际性能方面业界和第三方评测机构评价没有那么高,软件层面从使用角度来讲也还有很大的成长空间。其他几家也陆续有产品推出,但技术能力还停留在推理层面,不像一梯队企业有更成熟的产品经验;三梯队,如海光、景嘉微等。技术能力还有待市场的认可和验证。

从产品来说,目前国内已经批量生产的产品大多都是A100的上一代,如昆仑芯三代、思远590、燧思3.0等,不过,各公司正在研发更新一代产品,缩小国内外差距。向后看,基于国家政策的大力支持,以及自主可控的迫切需求,中国厂商有望迎来更大的国产替代机遇。而如果国内产品能够替代英伟达的算力产品,将会是非常大的机会。数据中心建设方面也需要服务器,会带动国内提供大型服务器的厂商,比如浪潮信息、中科曙光等,以及光模块、调节芯片和散热技术,需求都会受益于大模型浪潮。相信随着国内企业的持续投入和创新,以及政府的支持,中国在人工智能领域的发展势头仍然很强,有望逐步缩小与国外竞争对手的差距。

AI的一切才刚刚开始,其带来的潜在生产力提升和劳动力供应的增加等结果不可低估。而从当下的投资时点来看,2024年半导体芯片板块投资或许可以关注三条主逻辑:一是周期底部,景气复苏;二是人工智能推动超级创新周期,AI芯片迎来发展机遇;三是国产替代研发成果正在逐步落地,突破性产品发布。