欢迎访问深圳市中小企业公共服务平台电子信息窗口
皮衣老黄再出震圈之作!AI芯片还是英伟达的天下
2024-03-20 来源:贤集网
1934

关键词: 人工智能 芯片 英伟达

时隔5年,全球顶尖AI计算技术盛会、年度NVIDIA GTC大会重磅回归线下,就在刚刚,英伟达创始人兼CEO黄仁勋发表长达123分钟的主题演讲,发布AI芯片最新震圈之作——Blackwell GPU。

当地时间3月18日13点,北京19日凌晨4点,GTC最重磅的主题演讲正式开始,在播放一段AI主题短片后,黄仁勋穿着标志性的黑色皮衣从圣何塞SAP中心场馆主舞台登场,与观众寒暄。



他首先回顾了英伟达30年来追求加速计算旅程的开端,历数研发革命性计算模式CUDA、将首台AI超级计算机DGX交给OpenAI等一系列里程碑事件,然后将话题自然地聚焦到生成式AI上。

在宣布与多家EDA龙头的重要合作伙伴关系后,他谈到快速演进的AI模型带动训练算力需求暴涨,需要更大的GPU,“加速计算已达到临界点,通用计算已失去动力”,“在每一个行业,加速计算都比通用计算有了巨大的提升”。

紧接着,大屏幕上过电影般快速闪现从GPU、超级芯片到超级计算机、集群系统的一系列关键组件,然后黄仁勋重磅宣布:全新旗舰AI芯片Blackwell GPU,来了!

这是GPGPU领域最新的震圈之作,从配置到性能都将前辈Hopper GPU拍倒在沙滩上。他举起双手展示了Blackwell和Hopper GPU的对比,Blackwell GPU明显大了一圈。

毕竟手心手背都是肉,对比完后,黄仁勋马上开始安慰:“It’s OK, Hopper. You’re very good, good boy, or good girl.”

但也不能怪老黄喜新厌旧,因为Blackwell的性能,实在是太强了!无论是FP8,还是全新的FP6、FP4精度,以及HBM能塞下的模型规模和HBM带宽,都做到“倍杀”前代Hopper。

8年,从Pascal架构到Blackwell架构,英伟达将AI计算性能提升了1000倍!


最新芯片技术Blackwell发布

发布会上,黄仁勋宣布英伟达(NVIDIA)将推出用于万亿参数级生成式AI的NVIDIA Blackwell架构。搭载Blackwell技术,英伟达将推出B200和GB200系列芯片。

这些超级AI芯片相比英伟达自身产品也有巨大提升。据介绍,B200拥有2080亿个晶体管,而H100/H200有800亿个晶体管,采用台积电4NP工艺制程,可以支持多达10万亿个参数的AI大模型。GB200将两个B200 Blackwell GPU与一个基于Arm的Grace CPU进行配对。



新的芯片架构和技术将极大改善能耗。黄仁勋举例称,如果要训练一个1.8万亿参数量的GPT模型,需要8000张Hopper GPU,消耗15兆瓦的电力,连续跑上90天。但如果使用Blackwell GPU,只需要2000张,跑90天只要消耗四分之一的电力。

英伟达表示,基于Blackwell的处理器,如GB200,为人工智能公司提供了巨大的性能升级,其AI性能为每秒20千万亿次浮点运算,而H100为每秒4千万亿次浮点运算。该系统可以部署一个27万亿参数的模型。黄仁勋称,毫无疑问,微软Azure、AWS、谷歌云等一众科技巨头都是Blackwell架构的首批用户。

英伟达在公告通稿中列举了将采用Blackwell的一些组织,比如微软、亚马逊、谷歌、Meta、戴尔、OpenAI、甲骨文、马斯克领导的特斯拉和xAI。黄仁勋介绍了包括这些公司在内的更多合作伙伴。

在演讲中,黄仁勋宣布推出新的AI微服务,用于开发和部署企业级生成式AI应用。黄仁勋表示,未来如何开发软件?与现在一行行代码不同,未来可能就要靠一堆NIMs(Nvidia inference micro service),用与AI聊天的形式调动一堆NIMs来完成训练、应用的部署。英伟达的愿景是成为AI软件的“晶圆厂”。

目前,英伟达的AI微服务NIM网站已经上线。据介绍,NIM微服务提供了最快、性能最高的AI生产容器,用于部署来自NVIDIA、A121、Adept、Cohere、Getty Images和Shutterstock的模型,以及来自Google、Hugging Face、Meta、Microsoft、Mistral AI和Stability AI的开放模型。


充分发挥英伟达优势的新AI生态系统

早在AI还以自动驾驶为主旋律的时期,英伟达就已经开始向车企客户推广其云端服务解决方案。而为了满足AI大模型时代的模型共享、模型定制化、模型运行、云计算支持在内的一系列问题,英伟达在这次GTC上推出了全新的“英伟达推理微服务(NIM)”。

NIM在构建的过程中,充分借鉴了K8S(Kubernetes)这些年的成功经验,将行业API,AI算法支持库、云端架构支持、AI算法加速、定制模型、定制存储、企业管理等诉求都注入到一个小的“容器”中,进而将AI模型的成果打包和部署过程高度简化。



如果说容器化的理念已经很可怕,那么更可怕的是这套解决方案,与目前AI行业智能体发展趋势的契合度。

早在去年,在ChatGPT能力之上二次开发的AutoGPT就曾大火过一波,当时AutoGPT的策略是通过ChatGPT的多次循环,实现对复杂目标的拆分和分散寻找答案。但随着后来的实践,整个行业其实已经看到了其能力的局限性——单靠语言大模型并不能解决所有问题。

而目前行业内比较赞同的解决方案,就是在不断提升基础大模型能力的基础上,不断针对小的场景,提供专门的数据和目标,优化出解决一些问题的模型,也可以叫做“智能体”。通过这些“智能体”数量和覆盖的累积,以及基础大模型的调度能力,最终让AI实现“自我计划、自我协调”的进阶人工智能水平。更形象的说,就是一个输入框解决用户的绝大部分需求。

而持续为云端提供充沛AI运行能力的英伟达,显然有推进这套机制的资本。

在有望加速全行业AI应用落地之余,英伟达的这套NIM体系,还将把各种有潜力的AI模型和应用,紧紧地绑定在英伟达有着明显优势的云端算力性能和成本之上,进一步对抗由智能手机厂商发起的端侧攻势,让其紧握远期实现通用人工智能(AGI)的先机。

根据英伟达官方目前公布的计划,NIM体系将在NVIDIA AI企业版中首发,虽然NIM本身不收费,但是NVIDIA AI企业版收费不低,单GPU的使用权限包年就需要4500美金,小时租金为1美元每小时。


「现实 AI」:数字仓库和机器人

在推进算力和算力的使用上,英伟达是认真的。英伟达在二十年前就做出了 CUDA,推崇加速计算,今日的硕果累累来自于二十年前种下的因。

黄仁勋开场时回顾二十年前,半开玩笑地讲到:「当时我们已经算到了有今日。」

而黄仁勋看到的未来是什么样的呢?

在今天的 GTC 上,我们也小小地瞥见了一下黄仁勋眼中的未来:在世界的底层,是无限扩展的、不竭的算力,在中层,是数字孪生,是 simulation,是依靠算力带来的对物理世界的无限精准的模仿,实验和预测,而在上层,则是一个依靠算力达到最优解的世界——在这个世界里,人与机器人共生。一切第一次发生的,都是发生过无数次的。

这其中,英伟达 2021 年开始推出的 Omniverse,就是中间层非常重要的工具。

Omniverse 是英伟达擅长的计算机图形、人工智能、科技计算和物理模拟真正大一统的平台,能够对环境实现 1:1 的数字孪生。

此次发布会,结合人工智能的浪潮,Omniverse 展现了许多新的应用可能。



Omniverse 可以为现在最火的具身智能,提供一个训练场所。英伟达表示,英伟达建立了 Isaac Lab,一款机器人学习应用程序,用于在 Omniverse Isaac 模拟器上进行训练。通过新的计算编排服务,可以在基于物理的模拟中训练机器人,并能零次训练(zero-shot)迁移到实际环境。

机器人模型将使机器人能够从少量人类演示中学习,从视频中理解人类、在模拟中训练模型,并最终直接部署到物理机器人上。

黄仁勋还在发布会上宣布了 Project GR00T 项目,GR00T 是一个用于人形机器人的通用基础模型,基于 Jetson Thor(英伟达的一款GPU)来开发生产机器人。

除此之外,英伟达还展示了一个数字仓库的案例。

视频中,展示了一个一个 10 万平方英尺仓库的 Omniverse 模拟环境,它整合了运行视频、Isaac 感知器堆栈的数字工人 AMR、来自 100 个模拟天花板安装摄像头的整个仓库的集中活动地图等。

在视频中,一个数字工人 AMR 的原定计划的路线上,发生了一起事故,路径受阻。英伟达 Metropolis 可以实时改变路径规划。通过基于生成式 AI 的 Metropolis 视觉基础模型,操作员甚至可以使用自然语言提问发生了什么事情。

在此次 GTC 上,英伟达宣布,将创建 Omniverse Cloud 的 api,而且将非常易用,企业可以更容易地使用 Omniverse,同时其中还将有 AI 的能力。比如可以直接用自然语言场景描述,创建仿真环境的 3D 图像。

同时,英伟达宣布与 Vision Pro 达成合作,Omniverse Cloud 将能够向 Vision Pro 串流。「从虚拟车上下来,穿过车门的感觉,非常奇怪,但也非常棒。」黄仁勋讲到,「Vision Pro 将把你带入 Omniverse Cloud,你能够体验到的工作流是无与伦比的。」

超过 1 万人在现场观看 Keynote,900 场以上的分享以及数百家展商,2024 年 GTC 被戏称为「AI 界的伍德斯托克」——除了苹果公司,少有公司能让科技变成一种人人想要「沾上边」的时尚。毕竟,在「生成式 AI」代表未来的当下,每个人都想成为那个跟上潮流的人。

英伟达无疑是那个潮流背后最大的推手之一,同时也是目前最大的受益方,它需要做的,是为所有人提供更大的梦想,和更多的算力。顺便,或许,成为全球市值最高的公司,没有之一。