马斯克带领 xAI 团队发布 Grok 4 「全球最强模型」含金量如何？

作者：
刘晓洁

　　7 月 10 日中午 12 点，经历了前一代模型的延期和此次直播推迟，埃隆·马斯克终于现身 Grok 4 发布会进行开场，画面中的他略显憔悴，一周前提及「和 xAI 团队通宵打磨模型」，看起来为这次发布准备已久。

　　在帖子中，官方称此次发布的 Grok 4 是「全球最强大的 AI 模型」，马斯克则在直播中表示，「Grok 4 几乎在所有学科上都比人类研究生更聪明」，具体含金量如何？

　　数据显示，Grok 4 的多项基准测试很能「打」，实现了对现有顶尖模型的超越。在 AIME25 数学竞赛上，Grok 4 拿下了满分，在「人类最后的考试」（HLE）测试中，不用工具的情况下拿下了 26.9% 的高分，该测试包含 2500 个专家级问题，涵盖上百个学科。

　　测评机构 Artificial Analysis 获得早期访问权限并在发布会后公布了 Grok 4 基准测试，官方提到，Grok 4 的人工智能分析指数达到 73，「是我们的智能指数首次将 xAI 列为第一名」。从数据来看，Grok 4 领先于 OpenAI o3（70）、谷歌 Gemini 2.5 Pro（70）、Anthropic 的 Claude 4 Opus（64）和国内 DeepSeek R1 0528（68）。

　　根据 Artificial Analysis 的测试，在「人类最后的考试」中 Grok 4 则取得了 24% 的历史最高分，超过了谷歌 Gemini 2.5 Pro 之前 21% 的历史最高分。不过，测试分数只是一方面，Grok 4 模型的能力还需要看后续开发者们实际使用的效果，目前模型刚推出不久，实测案例并不多。

　　xAI 团队在直播中透露，Grok 4 的训练量是 Grok 2 的 100 倍，在强化学习（RL）阶段投入的算力，是市面上其他任何模型的 10 倍以上。发布会介绍，Grok 4 的订阅费为 30 美元/月，更强大的 Grok 4 Heavy 版本的费用为 300 美元/月，Grok 3 维持免费开放。

　　值得一提的是，此次直播比原定的时间推迟了约一小时。xAI 准点发布帖子称「Grok 4 直播即将开始」，但 1 小时过去直播仍未推出，评论中网友们一边催更，一边质疑是否「又是炒作」。

　　在这之前，马斯克在 X 上频频为 Grok 模型预热，但 Grok 3.5 模型最终跳票，一度引发对模型能力的怀疑。4 月底，马斯克就在 X 上预告，Grok 3.5Beta 版下周将上线，主打专业问答能力，特别是工程、编程类问题。但直到 5 月中旬，马斯克才出来回应称，「还有点粗糙，再打磨一周。」

　　马斯克在 6 月 27 日再次提到 Grok，表示在和 xAI 团队通宵打磨模型，进展不错，即将发布的模型被命名为 Grok 4。也就是说马斯克和团队选择跳过 Grok 3.5，「端」出更高的迭代版本，针对模型跳票后外界的质疑，看起来是一个很好的挽救方案。

　　从这次迟到看，发布显得有些仓促，不过从性能测试看没有让行业失望。xAI 整个团队为这次 Grok 4 的发布熬了不少夜，此前有博主访问了 xAI 的办公室，画面显示办公区走廊两侧全是帐篷，这意味着不少核心员工近段时间可能都睡在办公室。

　　马斯克在 2023 年 7 月才成立 xAI，两年时间就追上了行业最顶尖的水平，充足的资金和算力是他的筹码。

　　为了支持 Grok 的开发和训练，马斯克在美国田纳西州孟菲斯建立了超级计算中心「Colossus」，在 2024 年 7 月启动时配备了 10 万块英伟达H100 GPU，到 2025 年 2 月，GPU 数量已翻倍至 20 万块。马斯克计划将孟菲斯超级集群的规模扩展到 100 万块 GPU，并且正在为此筹集资金。

　　就在上周 6 月 30 日，华尔街大行摩根士丹利在 X 上发布声明称，xAI 已完成总计 100 亿美元的新一轮融资，其中包括 50 亿美元债务融资和 50 亿美元股权融资。这是 xAI 继去年两轮各 60 亿美元的融资后、又一轮大额融资，2024 年以来 xAI 公开的总融资额已达 220 亿美元（约为人民币 1579 亿元）。

　　目前尚不清楚本轮融资后 xAI 的具体估值，此前 3 月 xAI 与 X 合并后估值高达 1130 亿美元。其中 xAI 估值为 800 亿美元，X 的估值为 330 亿美元。

　　但如此庞大的融资，也很难支撑大模型公司的巨额花销。据媒体援引消息人士报道，xAI 目前每月消耗高达 10 亿美元，截至 2025 年 3 月底，公司账面现金仅剩 40 亿美元。此次融资后，xAI 或许能支撑一段时间，但明年还需继续筹资，目前其收入远远小于其成本。

　　马斯克曾公开表示，像 xAI 这类巨额亏损在整个 AI 行业并不罕见，主要源自高昂的服务器建设和芯片采购成本。

　　xAI 在商业化进展方面的表现还落后于一些竞争对手，xAI 的主要营收来源是 X Premium 的订阅服务，预计 2025 年营收仅为 5 亿美元，明年预计可达到 20 亿美元。对比来看，OpenAI 预计 2025 年营收将达 127 亿美元，且业务更加多元化。

　　虽然此次 Grok 4 短暂领先了，但今年夏天 OpenAI 也将发布其最新旗舰模型 GPT-5，这一领先优势能保持多久并不确定。海外大厂对于 AI 模型也是势在必得，微软、亚马逊、谷歌和 Meta 四大巨头去年的总资本支出为 2300 亿美元，2025 年这些公司的投资计划则高达 3200 亿美元，在财报中管理层纷纷表示，计划增加对 AI 技术和数据中心建设的投资。

　　xAI 对未来较为乐观。在与 X 合并后，xAI 团队希望，能够利用 X 上庞大且不断更新的数据档案来训练其模型，从而避免像其他公司那样支付昂贵的数据费用。xAI 乐观地预计将在 2027 年实现盈利，相比之下，OpenAI 据悉预计要到 2029 年才能实现现金流转正。

　　编程和更强大的多模态智能体是 xAI 接下来的看点。在此次直播中，团队定下目标，在 8 月发布编程模型，9 月发布多智能体，10 月发布视频生成模型。不过，结合此前多次的延期，这个时间点是否靠谱还需要打个问号。

（第一财经）

文章转载自东方财富