作者:
刘晓洁
7 月 10 日中午 12 点,经历了前一代模型的延期和此次直播推迟,埃隆·马斯克终于现身 Grok 4 发布会进行开场,画面中的他略显憔悴,一周前提及 「和 xAI 团队通宵打磨模型」,看起来为这次发布准备已久。
在帖子中,官方称此次发布的 Grok 4 是 「全球最强大的 AI 模型」,马斯克则在直播中表示,「Grok 4 几乎在所有学科上都比人类研究生更聪明」 ,具体含金量如何?
数据显示,Grok 4 的多项基准测试很能 「打」,实现了对现有顶尖模型的超越。在 AIME25 数学竞赛上,Grok 4 拿下了满分,在 「人类最后的考试」(HLE) 测试中,不用工具的情况下拿下了 26.9% 的高分,该测试包含 2500 个专家级问题,涵盖上百个学科。
测评机构 Artificial Analysis 获得早期访问权限并在发布会后公布了 Grok 4 基准测试,官方提到,Grok 4 的人工智能分析指数达到 73,「是我们的智能指数首次将 xAI 列为第一名」。从数据来看,Grok 4 领先于 OpenAI o3(70)、谷歌 Gemini 2.5 Pro(70)、Anthropic 的 Claude 4 Opus(64) 和国内 DeepSeek R1 0528(68)。

根据 Artificial Analysis 的测试,在 「人类最后的考试」 中 Grok 4 则取得了 24% 的历史最高分,超过了谷歌 Gemini 2.5 Pro 之前 21% 的历史最高分。不过,测试分数只是一方面,Grok 4 模型的能力还需要看后续开发者们实际使用的效果,目前模型刚推出不久,实测案例并不多。
xAI 团队在直播中透露,Grok 4 的训练量是 Grok 2 的 100 倍,在强化学习 (RL) 阶段投入的算力,是市面上其他任何模型的 10 倍以上。发布会介绍,Grok 4 的订阅费为 30 美元/月,更强大的 Grok 4 Heavy 版本的费用为 300 美元/月,Grok 3 维持免费开放。
值得一提的是,此次直播比原定的时间推迟了约一小时。xAI 准点发布帖子称 「Grok 4 直播即将开始」,但 1 小时过去直播仍未推出,评论中网友们一边催更,一边质疑是否 「又是炒作」。
在这之前,马斯克在 X 上频频为 Grok 模型预热,但 Grok 3.5 模型最终跳票,一度引发对模型能力的怀疑。4 月底,马斯克就在 X 上预告,Grok 3.5Beta 版下周将上线,主打专业问答能力,特别是工程、编程类问题。但直到 5 月中旬,马斯克才出来回应称,「还有点粗糙,再打磨一周。」
马斯克在 6 月 27 日再次提到 Grok,表示在和 xAI 团队通宵打磨模型,进展不错,即将发布的模型被命名为 Grok 4。也就是说马斯克和团队选择跳过 Grok 3.5,「端」 出更高的迭代版本,针对模型跳票后外界的质疑,看起来是一个很好的挽救方案。
从这次迟到看,发布显得有些仓促,不过从性能测试看没有让行业失望。xAI 整个团队为这次 Grok 4 的发布熬了不少夜,此前有博主访问了 xAI 的办公室,画面显示办公区走廊两侧全是帐篷,这意味着不少核心员工近段时间可能都睡在办公室。

马斯克在 2023 年 7 月才成立 xAI,两年时间就追上了行业最顶尖的水平,充足的资金和算力是他的筹码。
为了支持 Grok 的开发和训练,马斯克在美国田纳西州孟菲斯建立了超级计算中心 「Colossus」,在 2024 年 7 月启动时配备了 10 万块英伟达H100 GPU,到 2025 年 2 月,GPU 数量已翻倍至 20 万块。马斯克计划将孟菲斯超级集群的规模扩展到 100 万块 GPU,并且正在为此筹集资金。
就在上周 6 月 30 日,华尔街大行摩根士丹利在 X 上发布声明称,xAI 已完成总计 100 亿美元的新一轮融资,其中包括 50 亿美元债务融资和 50 亿美元股权融资。这是 xAI 继去年两轮各 60 亿美元的融资后、又一轮大额融资,2024 年以来 xAI 公开的总融资额已达 220 亿美元 (约为人民币 1579 亿元)。
目前尚不清楚本轮融资后 xAI 的具体估值,此前 3 月 xAI 与 X 合并后估值高达 1130 亿美元。其中 xAI 估值为 800 亿美元,X 的估值为 330 亿美元。
但如此庞大的融资,也很难支撑大模型公司的巨额花销。据媒体援引消息人士报道,xAI 目前每月消耗高达 10 亿美元,截至 2025 年 3 月底,公司账面现金仅剩 40 亿美元。此次融资后,xAI 或许能支撑一段时间,但明年还需继续筹资,目前其收入远远小于其成本。
马斯克曾公开表示,像 xAI 这类巨额亏损在整个 AI 行业并不罕见,主要源自高昂的服务器建设和芯片采购成本。
xAI 在商业化进展方面的表现还落后于一些竞争对手,xAI 的主要营收来源是 X Premium 的订阅服务,预计 2025 年营收仅为 5 亿美元,明年预计可达到 20 亿美元。对比来看,OpenAI 预计 2025 年营收将达 127 亿美元,且业务更加多元化。
虽然此次 Grok 4 短暂领先了,但今年夏天 OpenAI 也将发布其最新旗舰模型 GPT-5,这一领先优势能保持多久并不确定。海外大厂对于 AI 模型也是势在必得,微软、亚马逊、谷歌和 Meta 四大巨头去年的总资本支出为 2300 亿美元,2025 年这些公司的投资计划则高达 3200 亿美元,在财报中管理层纷纷表示,计划增加对 AI 技术和数据中心建设的投资。
xAI 对未来较为乐观。在与 X 合并后,xAI 团队希望,能够利用 X 上庞大且不断更新的数据档案来训练其模型,从而避免像其他公司那样支付昂贵的数据费用。xAI 乐观地预计将在 2027 年实现盈利,相比之下,OpenAI 据悉预计要到 2029 年才能实现现金流转正。
编程和更强大的多模态智能体是 xAI 接下来的看点。在此次直播中,团队定下目标,在 8 月发布编程模型,9 月发布多智能体,10 月发布视频生成模型。不过,结合此前多次的延期,这个时间点是否靠谱还需要打个问号。

(第一财经)
文章转载自东方财富