欢迎访问深圳市中小企业公共服务平台电子信息窗口
高通2024年将发布哪些芯片?更大的“野心”在AI PC
2024-03-15 来源:贤集网
2641

关键词: 高通 芯片 人工智能

谁能想到,2024年刚开年,高通就在“大冲刺”一般地加快步伐了。

根据知名爆料数码博主@数码闲聊站透露,高通将于近期发布骁龙7+ Gen3以及骁龙8sGen3两款处理器,从命名方式和现阶段透露的参数来看,两者的定位应该都是中端市场,但有意思的是:骁龙7+ Gen3会是史上最强的骁龙7系处理器,甚至有可能威胁到当今旗舰骁龙8 Gen3的地位。

这就让小雷有些摸不着头脑了,按照高通之前的产品策略,一般都是让8系作为真旗舰,7系则是在两三千元档手机市场中「大杀四方」,为何今年一开年就要推出两款定位中端且实力远超市场预期的处理器呢?



骁龙7+ Gen3,人称“小8 Gen3”?

骁龙7+ Gen3相比去年发布的骁龙7 Gen3可谓是进步明显,在性能和能耗上都实打实地达到了旗舰水准。此话并非空穴来风,骁龙7+ Gen3采用的是骁龙8 Gen 3同款架构,也就是「1+4+3」的旗舰架构,内部核心也同样为Cortex-X4(超大核)、Cortex-A720(中核)、Cortex-A520(小核),唯一的区别在于频率方面有一定的阉割。不过GPU部分倒是从Adreno 750缩水成了Adreno 732,对于重度手游玩家来说可能有一定的影响。

其中阉割最明显的莫过于Cortex-X4超大核,从3.3GHz的睿频降到了2.8GHz,这0.5GHz的差异会让骁龙7+ Gen3在超高负载场景下的性能表现被骁龙8 Gen3拉开一截,但也只是超高负载场景,像日常使用以及一些常规的高负载场景,两者的差距几乎可以视为0,你甚至可以把它看作是骁龙8 Gen2的加强版。

而骁龙8s Gen3和8 Gen3的差距就更小了,两者无论是在核心和GPU方面的差异都在10%以内,但功耗部分却有明显的下降,如此细微的差距让小雷有些难以理解。

唯一让小雷觉得合理的部分是,目前曝光将搭载这两款处理器的机型均是两三千元档的中端手机,虽说产品力也相当不俗,但对比起各家的旗舰仍有不小的差距。


骁龙全新旗舰芯来了!

高通宣布将在 3 月 18 日举行骁龙旗舰新品发布会,届时将带来全新的骁龙旗舰芯片产品。虽然目前高通并未透露关于新芯片的更多信息,不过已经有不少可靠消息被披露。

首先高通即将推出的旗舰芯片共有两款,分别是骁龙 8s Gen3 和骁龙7+ Gen3,其核心架构继承骁龙8 Gen3,技术上也与之同代同系,均采用台积电 4nm 工艺制造,定位新一代次旗舰 5G 芯片平台。

在核心规格上,骁龙 8s Gen3 的 CPU 由 1 × Cortex X4 超大核心(3.01GHz)、4 × A720 大核心(2.61GHz )和 3 × A520 小核心(1.84GHz )组成,图形处理器 GPU 为 Adreno 735。

从这里可以发现,骁龙 8s Gen3 最高主频 3.01GHz 要低于骁龙 8 Gen3 的 3.30GHz,换句话来说,前者是后者的降频版,其综合性能介于骁龙8 Gen2 和骁龙8 Gen3 之间,预计安兔兔跑分在 170 万分附近,这与大众“8s”名称会强于“8”的普遍认知相悖。

没错,骁龙 8s Gen3 可以理解为是骁龙 8 Gen3 青春版,理论上其续航和发热表现会更好。

高通骁龙7+ Gen 3 同样采用“1+4+3”的核心架构,分别是 1 × Cortex X4(2.9GHz)+ 4 × A720(2.6GHz )+ 3 × A520(1.9GHz ),GPU为 Adreno 732。

可以发现,骁龙 7+ Gen3 最高主频 2.9GHz 要低于骁龙 8s Gen3 的 3.01GHz,也就是说骁龙 7+ Gen3 可以理解为骁龙 8s Gen3 的青春版。

骁龙7+ Gen 3 的综合性能“plus”如其名,将会显著超过骁龙7 Gen3 和骁龙7+ Gen2,安兔兔跑分超 150 万,性能介于骁龙8+ Gen1 和骁龙8 Gen2 之间。



高通的AI野心

作为全球芯片巨头,高通公司在本次MWC上也发布了多款AI赋能的重磅产品,并带来多个生成式AI方面的展示。

去年10月,高通发布了面向手机的第三代骁龙8移动平台,以及面向PC的骁龙X Elite平台,引起了全行业的轰动。

这两款平台,都在AI能力上进行了重点升级。第三代骁龙8甚至被称为首款“专为生成式AI”而精心打造的移动平台,采用基于异构计算架构的高通AI引擎,其中Hexagon NPU等AI计算硬件全面加强,大幅提升了终端侧的AI能力。

第三代骁龙8可处理的大模型参数超过100亿,每秒可生成高达20个Token。而骁龙X Elite更是支持PC运行超过130亿参数的大模型,运行70亿参数大模型每秒生成30个Token。如果把这个衡量标准放在具体情境中,普通人每分钟可阅读约200-300个单词,这相当于每秒处理5-7个tokens,而骁龙的终端侧AI的书写速度比人们的阅读速度还要快。这种底层AI能力堪称是颠覆性的。

正是基于骁龙强大的平台,小米、荣耀、OPPO、iQOO、一加、三星等厂商自去年年底发布的众多智能手机旗舰产品,才拥有卓越的终端侧AI能力,能够对AIGC大模型在终端落地提供支持。同时,在即时性、可靠性、隐私以及个性化等方面,也带来了显著的提升。

高通在本次MWC上的发布,重点聚焦在通信连接能力上。

他们推出了两个重要的解决方案,分别是高通FastConnect 7900系统,以及骁龙X80 5G调制解调器及射频系统。


双管齐下,推动终端侧生成式 AI 生态建设

而在软件和应用生态建设方面,高通则是同时“两手发力”,一方面在软件层面为开发者打造生成式 AI 应用提供便利,另一方面则是积极和终端以及应用厂商合作,推动生成式 AI 创意应用以及终端产品的落地。

比如高通一开始就意识到,让开发者能够获取基于异构计算的 AI 加速,对于终端侧生成式 AI 的规模化扩展至关重要,因此他们打造了 AI 软件栈(Qualcomm AI Stack)。它能够支持目前所有的主流 AI 框架,包括 TensorFlow、PyTorch、ONNX、Keras;它还支持所有主流的 AI runtime,包括 DirectML、TFLite、ONNX Runtime、ExecuTorch,以及支持不同的编译器、数学库等 AI 工具。

此外他们还推出了 Qualcomm AI studio,为开发者提供开发过程中需要用到的相关工具,其中包括支持模型量化和压缩的高通 AI 模型增效工具包(AIMET),能够让模型运行更加高效。高通 AI 软件栈是当前边缘侧的业界领先解决方案。

同时,高通还专注于 AI 模型优化,以实现能效和性能提升。他们认为,快速的小型 Al 模型如果只能提供低质量或不准确的结果,那么将失去实际用处。因此,高通采用了全面而有针对性的策略,包括量化、压缩、条件计算、神经网络架构搜索(NAS) 和编译,在不牺牲太多准确度的前提下缩减 Al 模型,使其高效运行。即使是那些已经面向移动终端优化过的模型我们也会进行这一工作。

例如,量化有益于提升性能、能效、内存带宽和存储空间。Hexagon NPU 原生支持 INT4,高通 AI 模型增效工具包(AIMET)5 提供基于高通 AI 研究技术成果开发的量化工具,能够在降低位数精度的同时限制准确度的损失。



对于生成式 AI 来说,由于基于 Transformer 的大语言模型(比如 GPT、Bloom 和 Llama)受到内存的限制,在量化到 8 位或 4 位权重后往往能够获得大幅提升的效率优势。

高通的这些努力也带来了现实中实际应用的意义,从去年下半年到今年,不少手机厂商都在自家的产品中引入了端侧 AI 大模型,这背后本质上就离不开与高通的深入合作攻关。以 OPPO 为例,他们在 OPPO Find X7 旗舰手机中搭载了自主训练的 AndesGPT 70 亿参数大模型,在此基础上实现了通话摘要、AIGC 消除等热门出圈的功能。

而 70 亿参数的 AndesGPT 大模型能够在终端上以低功耗的方式顺畅运行第三代骁龙 8 平台对 INT4 量化技术的支持也可以提供强大的助力。OPPO 已经可以利用 INT4 量化技术实现对模型的大幅度压缩,让原本占用 28GB 内存的模型现在只需要 3.9GB,降低资源需求的同时也几乎不影响 AI 模型的输出效果。

除了终端硬件厂商,高通也在与软件厂商们合作推动生成式 AI 应用的落地,比如此前有报道称,他们和国内的慧鲤科技,面向第三代骁龙 8 开发了一个神经网络,能够重构照片缺失的部分,即“照片扩充”,它能支持用户对照片进行缩放,让照片看起来具有广角效果,即使并非用广角镜头拍摄。

再回到软件方面,今年的 MWC 上,高通还推出了全新的高通 AI Hub,可以为开发者提供全面优化的 AI 模型库,包括传统 AI 模型和生成式 AI 模型,能够支持在骁龙和高通平台上进行部署。

开发者只需选择应用所需的模型以及其开发应用所使用的框架,然后确定目标平台,例如一款特定型号的手机、或者一款特定型号的高通平台,简单来说,只需要几行代码就可以获取模型,并将模型集成进应用程序,大大节省了开发者在应用中部署 AI 大模型的时间和工作量。

还有在 PC 方面,骁龙 X Elite 最重要的合作者莫过于微软,高通一直在和微软工程团队合作优化全新平台的特性,微软表示,绝大多数顶级应用都将以超快速度和能效在搭载骁龙 X Elite 计算平台的 Windows PC 上原生运行或通过无缝仿真运行,特别是微软自身的生产力应用,包括 Word, Excel, Powerpoint, Edge, Teams, OneDrive, OneNote 和 Outlook 都是原生的。

对于 Windows 11,微软也改进了 Windows Studio Effects、宣布推出了 AI Library,在更新中为 Copilot 和 Paint 等收件箱应用程序中引入生成式 AI,还与诸如 Camo、Luminar Neo、WhatsApp 等进行合作,共同优化 Windows 平台的生成式 AI 应用体验。

总之,高通正基于 AI 软件栈和核心硬件 IP,跨过所有不同产品线,将应用规模化扩展到不同类型的终端,从智能手机到 PC、物联网终端、汽车等等。这无疑为其合作伙伴以及用户带来显著优势,开发一次就能覆盖高通不同芯片组解决方案的不同产品和细分领域进行部署,极大地助力厂商和开发者将打造生成式 AI 应用的效率和收益最大化。