欢迎访问深圳市中小企业公共服务平台电子信息窗口

xAI 发布 Grok 4:AI 领域的新里程碑

2025-07-11 来源:深圳市电子商会
88

关键词: Grok 4 发布 马斯克 跑分数据 单代理 四代理

马斯克在直播当中.jpg

北京时间 7 月 10 日,xAI 的 Grok 4 在万众瞩目中正式发布。


本次发布会原定于上午 11 点开始,却 “鸽” 了观众整整一小时,不过这并未削减大家的热情,140 万观众在线催更,评论数飙升至 4200 条,转发超 2000 次,点赞破万。


埃隆・马斯克亲自为 Grok 4 站台,他略显憔悴,可见为这次发布准备已久。

马斯克的ai的对比数据2.jpg

马斯克的ai的对比数据1.jpg

在发布会上发布的Grok4数据(部分)

Grok 4 依托 xAI 自建的超级计算集群 “Colossus” 进行研发。从官方公布的跑分数据来看,Grok 4 表现卓越。在 “人类的最后考试”(Humanity's Last Exam)中,Grok 4 在无需 “工具” 的情况下取得了 25.4% 的准确率,超过了谷歌 Gemini 2.5 Pro 的 21.6% 和 OpenAI o3(高版本)的 21%。配备 “工具” 的 Grok 4 Heavy 更是获得 44.4% 的得分,优于配备工具的 Gemini 2.5 Pro 的 26.9%。在 ARC - AGI - 2 测试中,Grok 4 取得了新的最高得分,得分为 16.2%。此外,在 GPQA、AIME25、LCB(Jan - May)、HMMT25 等多项测评中,Grok 4 都超越了 OpenAI o3、Gemini 2.5 Pro、Claude 4 Opus 等模型,并且xAI 宣称 Grok 4 “在几乎所有学科领域已超越人类博士水平”


Grok 4 系列包含两款产品。Grok 4 是单代理推理引擎,响应速度提升了 100%,支持 128K 上下文窗口的实时长文档分析。Grok 4 Heavy 采用四代理并行架构,拥有 256K 超长上下文和工具原生内化能力,能实时接入 X 平台数据流,在 5 秒内完成 MLB 世界大赛冠军概率分析。


Grok 4 还首次引入多模态信息处理功能,可处理图像、视频等信息,还能从社交媒体整合信息生成市场预测。语音模式也有改进,端到端延迟减半,同时新增五种声音模式。


开发者生态方面,xAI 计划 8 月推出 Grok4 Code。其集成专业编程工具,支持代码生成、错误检测等功能。


价格方面,Grok 4 API 每百万 tokens 输入 3 美元,输出 15 美元。SuperGrok 的月费为 30 美元,可解锁 Grok 4 的能力;Super Grok Heavy 会员月费高达 300 美元,能访问 Grok 4 和多智能体版本 Grok 4 Heavy。


不过,Grok 4 的发布也引发了一些争议。此前 Grok 曾出现过发布冒犯性内容的情况。对此,马斯克在发布会上也提到,Grok 4 有时可能缺乏常识,但他相信随着时间推移,Grok 4 会不断完善。