欢迎访问深圳市中小企业公共服务平台电子信息窗口
美国不遗余力限制我国算力发展,GPU国产替代如何才能突破?
2024-02-22 来源:贤集网
3417

关键词: 芯片 英特尔 AMD

众所周知,目前美国对中国的芯片限制越来越严格,在GPU上面也是如此。

2022年美国禁掉了高性能GPU芯片,包括A100、H100等,而2023年又禁掉了A800、H800、L40、L40S,甚至连桌面端显卡RTX 4090都禁了。

美国不希望中国拥有先进的GPU算力,从而在AI上超过美国。

于是有同学们会问了,那就是国产GPU能不能顶上?能不能替代nvidia、AMD这两大巨头?



国产GPU既有好也有差

事实上,GPU芯片目前主要分为两种,一种是普通GPU芯片,用于渲染的,我们也可以认为就是游戏加速,图形显示这些使用的普通显卡。

在这一块,国内在研制的比较多,但是份额相当少,数据显示,英特尔、AMD、nvidia这三大厂商占了全球98%以上的渲染类GPU市场,国产合计都不到2%。份额虽然少,不过性能方面,却已经不再落后nvidia、amd等多少了,比如芯动科技推出的高性能的4K级显卡GPU芯片“风华 1 号”,12nm工艺,性能略优于Nvidia的GTX980显卡。

再比如摩尔线程专为游戏玩家打造的独立显卡 MTT S80,能够提供多达 14.4TFLOPS 的单精度浮点算力,也是能够与nvida打一打的。

还有景嘉微等,也有推出一些国产渲染类显卡,不过由于时间较短,生态方面略逊色一点,所以份额不高,但要替代上来,在游戏方面,还是能够顶一顶的。

GPU芯片中,还有另外一种,叫做AI加速卡,比如英伟达的A100、H100、A800、H800等,主要服务于AI模型训练和推理等新兴的算力需求。

目前AI显卡方面,NVIDIA处于统治地位,市场份额超过97%,AMD拿走了2%,其它厂商加起来可能还不到1%。这一块追求的就完全是性能了,比如英伟达的H100,完全是打遍天下没有对手的。



中国企业瞄准存算一体AI芯片

生成式AI和大模型时代向算力基础设施提出的核心要求,可以简单概括为几个词:提高单芯片算力,突破算力利用率,实现更高能效比。

上海交通大学计算机科学与工程系教授、博导梁晓峣及其团队是开源GPGPU平台“青花瓷”的发起者。他谈道,当下需从系统的角度来思考问题。首先在单芯片算力方面,他非常看好存算一体,认为通过引入新型存储器件工艺,存算一体AI芯片有望将单芯片算力提高1——2个数量级。

但单颗芯片很难为大模型提供充足的计算资源与存储资源,这就需要将很多计算芯片连在一起,形成系统。据韩媒报道,受ChatGPT热潮驱动,韩国两大存储芯片巨头三星电子、SK海力士的高带宽内存(HBM)接单量大增。

芯片与芯片之间的数据传输过程,往往会造成大量不必要的资源浪费,导致计算系统受限于传输带宽瓶颈,在实际应用中发挥的算力远小于理论峰值算力。要进一步提升计算资源利用率,必须研究更先进的互连技术,以实现成千上万个AI芯片之间的高效协同。

最后,软件的迭代升级亦不可或缺。要降低芯片开发门槛并实现所有芯片的高效协同,需要设计分布式的AI编程软件平台,来解决线程调度、同步、任务平衡等复杂问题。

“没有一个单芯片能够独立解决大模型问题,所以一定是走向一个超异构。”梁晓峣说,尽管他很看好存算一体路线,但仅靠存算一体还不够,还需与其他架构配合,形成一个完整的系统。

亿铸科技首次提出的“存算一体超异构”概念,就有可能是一个未来的理想组合。

超异构计算将CPU、GPGPU、CIM(存内计算)等不同类型的芯片用先进封装技术组合,让不同架构各司其职,既有灵活、可编程的部分来适应算法的快速变化,又有定制化部分来提供超高性能和超低功耗,通过统筹调度,综合发挥出多类芯片架构的优势,将整体效率做到最优。

由于器件优势,存算一体在同等功耗下能承担更大算力。在超异构计算的基础上,以存算一体架构为核心,以其他架构作辅助,理论上能够兼顾对高算力与通用性的需求。亿铸科技创始人、董事长兼CEO熊大鹏博士相信,存算一体超异构将来会成为AI算力芯片的主流技术路线之一。

在今年2月份举行的国际芯片设计领域最高级别会议ISSCC 2023大会上,AMD董事长兼CEO苏姿丰也提出了相似的“系统级创新”概念,即综合考虑跨计算、跨通信、跨内存等各项元素,从整体上推动系统级性能和能效的提升。

而存算一体超异构理念的前瞻性和落地可行性在于,它不像基于传统计算架构的大算力芯片那样依赖先进制造技术。这一思路需结合的新架构、新存储、新封装等前沿技术,国内均已有储备。


英伟达芯片遇冷

国产GPU能否奋起?


当前,AI应用呈“井喷”式发展,算力需求暴涨,作为AI算力的核心,GPU俨然已成为炙手可热的“硬通货”,在此次展会上,英伟达也一口气推出三款新品。回顾2023年,凭借GPU芯片和以CUDA、数据中心专用GPU、软件库等为基础的AI生态,英伟达持续迎来“高光”时刻,美股市值达到上万亿美元,全年累涨近240%,创2001年以来最大年度涨幅。



然而,尽管英伟达在市场上气势如虹,后院却频频起火。去年10月,美国再次收紧AI芯片的出口管制政策,但中国市场的收入占到英伟达总营收的1/5左右,实在难以割舍。为此,英伟达展开了一场限制与反限制的“猫鼠游戏”,为中国市场量身定制了“降级版”芯片。但最近两天,外媒传出中国客户对英伟达“降级版”芯片兴趣不高的消息。

事实上,国内相关企业此前已经拿到“降级版”芯片样品进行测试,并被曝大量缩减相关订单。在行业人士看来,这款芯片不受待见的原因有三,一是性能大幅削弱,价格却并未下降。二是供应链风险,芯片限制政策可能会升级,不确定英伟达能否持续供货。三是使用“降级版”芯片将面临更多问题,如封装技术挑战、散热能耗更高等。

但如此前业内人士所言,目前英伟达H800的缺口有45万片,业界整体面临算力从哪来的问题。因此,短期内“降级版”芯片在国内依旧有市场。国内科技企业的工程师们也表示,未来12个月英伟达的芯片仍将是采购重点,因为英伟达的产品生态系统更加完善,而且本土替代品仍供应不足。

不过,对供需双方来说,“低配版”芯片始终不是长久之计,且在美国持续升级芯片限制政策的背景下,英伟达的供货极有可能波澜四起。因此,国内科技企业也积极调整产业策略,为未来减少使用英伟达芯片做准备,从而避免不断调整技术以适应新芯片的巨大代价。阿里和腾讯等云厂商将一些先进的半导体订单转移给华为等本土公司,并更多地依赖其内部开发的芯片,百度和字节跳动等企业也采取了类似措施。显然,国内企业选择“英伟达+自研+国产芯片”三管齐下进行探路。

常言道,三十年河东三十河西,当下华为昇腾910B、寒武纪思元370或许还不如英伟达“降级版”芯片,但从长远来看,华为、寒武纪等中国GPU企业持续加强产品研发和生态建设,实现GPU芯片的国产替代和系统化应用也只是时间问题。

当前,我国各类半导体器件都在加快国产化进程,美国的芯片出口管制政策反而将促进我国半导体发展进步。因为挡在国产半导体面前的,一直是外部过于廉价的供应,将产业磨灭在萌芽期,而在国际供应链不确定性背景下,国内芯片发展将迎来绝佳窗口期。回顾上世纪八九十年代,韩国半导体逆袭日本离不开政策、资金的鼎力相助,更离不开企业的“背水一战”,而如今的中国有政策、资金的大力支持,也不乏默默付出的耕耘者,实现国产替代的时间或许很长,但如同华为Mate60的发布,惊喜总会出现在某个平常日子里。