大消息！马斯克宣布推出 Grok 4，声称是全球最强 AI 模型，在处理这类问题上的表现已达到博士级别

每经编辑｜杜宇

官宣！中国对加拿大、英国实施免签；国投白银 LOF 估值调整补偿方案出炉；春节档总票房破 4 亿元；Grok 4.20 版本将于本周正式发布丨每经早参

最新！内塔尼亚胡：伊朗必须交出武器，拆除核设施！美媒：若美伊谈判失败，特朗普支持以空袭伊弹道导弹设施

7 月 10 日，特斯拉首席执行官埃隆·马斯克宣布推出 Grok 4，声称是全球最强 AI 模型，在处理学术问题上的表现，已达到博士级别。

据证券时报，马斯克表示，Grok 4 的订阅费为 30 美元/月，更强大的 Grok 4 Heavy 版本的费用为 300 美元/月，Grok 3 维持免费开放。官方曾表示，Grok 4 在自然语言、数学和推理上的性能无与伦比，是用户的最佳选择。

据悉，Grok 4 将深度整合特斯拉 AI 超级计算机系统，为全自动驾驶（FSD）及 Optimus 人形机器人提供核心技术支持。Grok 4或将重点强化逻辑推理与空间模拟能力。

据界面新闻，Grok 4 系列包含 Grok 4 和 Grok 4 Heavy 两个版本，均为纯推理模型。Grok 4 是单代理版本，Grok 4 Heavy 是多代理版本，支持四个代理同时工作，上下文窗口最高支持 256k tokens。

根据 xAI 的内部基准测试结果，Grok 4 在 Humanity』s Last Exam（一个涵盖数学、科学与语言等多学科、约 2500 道题目的权威考试）中，通过文本输入达到了约 25% 的正确率。这一数字与 OpenAI 在今年 2 月公布的 Deep Research 工具约 26% 的正确率不相上下。但 xAI 方面强调，两者测试方式并非完全相同。

xAI 工程师介绍模型训练情况（图片来源：界面新闻）

此次 Grok 4 的一个看点是新增五种声音模式，以及反应速度较早期几乎缩短了一半。为方便开发者使用，Grok 4 加入了专门的编程模型 Grok 4 Code，能在代码生成、调试等方面提供更专业的支持。xAI 表示，这一变化将明显提升开发者效率，以应对 GPT‑4 系列和 Meta Gemini 在编码领域的竞争。

在 xAI 的描述中，Grok 4 不仅具备「逻辑推理更强、语言理解更准确」的优势，还首次尝试加入多模态信息处理，如图像、视频的潜力。这使其在社交媒体内容上的应用更具时效性和文化敏感性。

不过，Grok 4 的推出伴随着不小的争议。直播前夕，旧版本 Grok 3 曾因传播不当言论引发外界批评。有声音认为，xAI 若不能在未来几周内提供更具结构性的模型安全机制，并公布更透明的训练方式，Grok 4 或很难摆脱「高性能之下的高风险」。

对此，马斯克强调，Grok 4 的更新目标是「成为尽可能追求真相的 AI」。他还设想通过该模型与类人机器人结合，在今年年底或明年发现新技术，甚至新物理定律。「这让人既兴奋又紧张，我希望自己能活着见证它的诞生。」马斯克说。

公开资料显示，xAI 成立于 2023 年 7 月，创始团队成员除马斯克外，还有来自谷歌 DeepMind、OpenAI、谷歌研究院等机构的 11 名成员，其中有 4 名华人。他们曾参与过 DeepMind 的 AlphaCode 和 OpenAI 的 GPT 3.5 和 GPT 4 等项目。

图片来源：视觉中国

今年 2 月，马斯克领导的 xAI 团队发布 Grok 3，该大模型被马斯克称为「地球上最聪明的 AI」。彼时，Grok-3 在发布会上展现出了极其强大的推理能力、逻辑应变能力、理解极度复杂物理知识以及空间模拟能力，当时在数学、科学和编程基准测试中超越了包括 Gemini 与 Claude、GPT-4o 在内的所有大模型竞品。

据了解，Grok 3 的诞生，标志着 AI 计算能力的全新时代。Grok 3 的训练规模堪称史无前例，xAI 公司动用了 20 万块英伟达 GPU，构建了全球最大的超算集群 Colossus。

这一训练过程分为两个阶段：第一阶段使用 10 万块 GPU，耗时 122 天；第二阶段扩展至 20 万块 GPU，耗时 92 天。如此庞大的算力投入，使得 Grok 3 的训练计算量达到前代 Grok-2 的 10 倍。

资料显示，Grok 3 的训练数据集极其庞大，包括了合成数据、公共网络数据以及专有数据，旨在增强模型的推理能力、解决复杂问题和理解人类语言的深度。马斯克在直播中强调，Grok 3 不仅是性能上的提升，更是一个在设计理念上的突破，它能够在推理过程中进行「自我反思」，这意味着 AI 可以识别并纠正错误，从而减少「幻觉」（hallucinations）现象。

每日经济新闻综合界面新闻、证券时报

文章转载自每经网