欢迎访问深圳市中小企业公共服务平台电子信息窗口
英伟达B200芯片及新架构发布,加码具身智能
2024-03-26 来源:Ai芯天下
1404

关键词: 人工智能 GPU 台积电

发布最强芯片B200,可组超级芯片GB200


英伟达全新推出的GPU平台Blackwell,兼容Hopper的普通系统以及连接Grace CPU的专用系统。


该平台催生了B200芯片,其晶体管数量高达2080亿,远超H100的800亿。


这一显著增长意味着B200芯片具有强大的并行计算能力,英伟达宣称其为全球领先的人工智能芯片。


B200能够在十万亿级参数模型上实现高效的AI训练和实时的LLM(大语言模型)推理。


B200由两个超大型Die(裸片)封装组合而成,内含超过2080亿个晶体管,较前一代的800亿个晶体管数量翻了一番。


此外,整块芯片还封装有192GB高速HBM3e显存,以满足高性能计算的需求。


通过将Grace CPU与两个B200 GPU结合,形成了超级芯片GB200。


与H00芯片相比,GB200为大模型推理负载提供了30倍的性能提升,同时降低了25%的成本和能耗。


与相同数量的英伟达H100 Tensor Core GPU相比,GB200 NVL72在LLM推理工作负载方面的性能最多可提升30倍,成本和能耗最多可降低25倍。


此外,英伟达还发布了基于GB200的DGX Super Pod一站式AI超算解决方案。


该方案采用高效液冷机架,配置8套DGX GB200系统,即288颗Grace CPU和576颗B200 GPU,内存总量达240TB。


其FP4精度计算性能高达每秒11.5百亿亿次,相比上一代产品,推理性能提升30倍,训练性能提升4倍。


值得注意的是,英伟达此次转向多芯片设计,放弃了传统的单体芯片策略。


这一转变源于B200所采用的台积电改进版N4P工艺,在晶体管密度上并未实现显著突破。


与此同时,H100芯片已接近其理论最大尺寸。因此,采用双芯片设计似乎是一种合理的选择。


[Blackwell]成为下一代AI平台


Blackwell是一款专为数据中心设计的先进芯片平台,针对当前热门的AI大模型进行优化,显著提升了训练和推理性能以及能效。


与英伟达的Grace CPU和新一代网络芯片等产品相结合,Blackwell共同构成了一个完整的生成式AI解决方案。


Blackwell不仅仅是一款芯片,更是一个全新的技术平台。


基于该平台,英伟达衍生出了包括GPU、AI超级芯片、服务器、大型计算集群和云服务在内的多套解决方案,为用户提供全方位的技术支持。


新款GPU架构[Blackwell]以美国数学家David Harold Blackwell命名,其中的GPU芯片B200采用了台积电4NP制造工艺。


在训练方面,Blackwell架构展示了显著效率。以往90天内,训练一个1.8万亿参数规模的模型需要8000个Hopper架构的GPU,并消耗15兆瓦的功率。


而现在,仅需2000个Blackwell架构的GPU,功率降低至4兆瓦,即可在相同时间内完成任务。


在推理领域,Blackwell架构的芯片性能是先前Hopper架构芯片的30倍。


除了硬件性能的提升,Blackwell还引入了第二代Transformer引擎。


该引擎通过为每个神经元使用4位而不是8位,实现了计算、带宽和模型大小的两倍提升。


同时,配备的第五代NVLink技术为每个GPU提供了1.8TB/s的双向吞吐量,确保了多达576个GPU之间的无缝高速通信。


目前,亚马逊云科技、戴尔科技、谷歌、Meta、微软、OpenAI、甲骨文、特斯拉和xAI等知名企业已计划采用Blackwell产品,以推动其AI技术和应用的进一步发展。


发布人形机器人,加码具身智能


英伟达在达到上一个万亿市值的过程中,主要得益于其在GPU与算力领域的卓越表现。展望未来,公司预测机器人开发领域将成为其市值增长的新动力。


今年初,英伟达资深科学家Jim Fan宣布成立GEAR工作室,其研究成果和研究环境为英伟达的新机器人解决方案奠定了坚实的基础。


英伟达近期发布了名为Project GR00T的人形机器人基础模型。这一模型具备通用性,可以作为机器人的核心处理器,使机器人具备学习和执行各种任务的能力。


通过语言、视频和人类演示,GR00T能够理解自然语言,模仿人类动作,并快速学习协调性、灵活性以及其他技能,从而与现实世界融合并与人类进行互动。


此外,英伟达对其针对机器人市场的Isaac机器人平台进行了重大更新。


新推出的Jetson Thor人形机器人计算机,基于Thor芯片,能够执行复杂任务并处理多个传感器数据。


该计算机具备每秒800万亿次8位浮点运算的AI性能,可以运行GR00T等多模态生成式AI模型,并简化设计和集成流程。


英伟达正在构建三大平台——IAI、Omniverse和ISAAC,这些平台均与机器人产业紧密相关。


IAI搭载DGX系列产品,用于模拟物理世界;Omniverse搭载RTX和OVX系列产品,驱动数字孪生的计算系统;而ISAAC则搭载AGX系列,驱动人工智能机器人。


同时,ISAAC Lab整合了ISAAC MANIPULATOR加速库平台和ISAAC PERCEPTOR软件库,分别用于提升机械臂的灵敏度和精确度以及服务机器人的感知能力。


英伟达透露,他们正在与多家人形机器人公司合作开发一个综合AI平台,包括1X Technologies、Agility Robotics、Apptronik、波士顿动力公司、Figure AI、傅利叶智能、Sanctuary AI、宇树科技和小鹏鹏行等。


这一战略举措有望为英伟达带来下一个万亿市值的增长空间。


结尾:


在黄仁勋看来,英伟达站在计算科学和物理等一切科学的交叉点,成为新工业革命的引擎。


除了硬件系统,英伟达也利用生成式 AI 构建了一系列元宇宙、工业数字孪生、机器人训练软件体系。


如今,黄仁勋已经在生成式AI领域拔得头筹,带领着下一场工业革命的开启。