每经编辑|杜宇
7 月 10 日,特斯拉首席执行官埃隆·马斯克宣布推出 Grok 4,声称是全球最强 AI 模型,在处理学术问题上的表现,已达到博士级别。
据证券时报,马斯克表示,Grok 4 的订阅费为 30 美元/月,更强大的 Grok 4 Heavy 版本的费用为 300 美元/月,Grok 3 维持免费开放。官方曾表示,Grok 4 在自然语言、数学和推理上的性能无与伦比,是用户的最佳选择。
据悉,Grok 4 将深度整合特斯拉 AI 超级计算机系统,为全自动驾驶 (FSD) 及 Optimus 人形机器人提供核心技术支持。Grok 4或将重点强化逻辑推理与空间模拟能力。
据界面新闻,Grok 4 系列包含 Grok 4 和 Grok 4 Heavy 两个版本,均为纯推理模型。Grok 4 是单代理版本,Grok 4 Heavy 是多代理版本,支持四个代理同时工作,上下文窗口最高支持 256k tokens。
根据 xAI 的内部基准测试结果,Grok 4 在 Humanity』s Last Exam(一个涵盖数学、科学与语言等多学科、约 2500 道题目的权威考试) 中,通过文本输入达到了约 25% 的正确率。这一数字与 OpenAI 在今年 2 月公布的 Deep Research 工具约 26% 的正确率不相上下。但 xAI 方面强调,两者测试方式并非完全相同。
xAI 工程师介绍模型训练情况 (图片来源:界面新闻)
此次 Grok 4 的一个看点是新增五种声音模式,以及反应速度较早期几乎缩短了一半。为方便开发者使用,Grok 4 加入了专门的编程模型 Grok 4 Code,能在代码生成、调试等方面提供更专业的支持。xAI 表示,这一变化将明显提升开发者效率,以应对 GPT‑4 系列和 Meta Gemini 在编码领域的竞争。
在 xAI 的描述中,Grok 4 不仅具备 「逻辑推理更强、语言理解更准确」 的优势,还首次尝试加入多模态信息处理,如图像、视频的潜力。这使其在社交媒体内容上的应用更具时效性和文化敏感性。
不过,Grok 4 的推出伴随着不小的争议。直播前夕,旧版本 Grok 3 曾因传播不当言论引发外界批评。有声音认为,xAI 若不能在未来几周内提供更具结构性的模型安全机制,并公布更透明的训练方式,Grok 4 或很难摆脱 「高性能之下的高风险」。
对此,马斯克强调,Grok 4 的更新目标是 「成为尽可能追求真相的 AI」。 他还设想通过该模型与类人机器人结合,在今年年底或明年发现新技术,甚至新物理定律。「这让人既兴奋又紧张,我希望自己能活着见证它的诞生。」 马斯克说。
公开资料显示,xAI 成立于 2023 年 7 月,创始团队成员除马斯克外,还有来自谷歌 DeepMind、OpenAI、谷歌研究院等机构的 11 名成员,其中有 4 名华人。他们曾参与过 DeepMind 的 AlphaCode 和 OpenAI 的 GPT 3.5 和 GPT 4 等项目。
图片来源:视觉中国
今年 2 月,马斯克领导的 xAI 团队发布 Grok 3,该大模型被马斯克称为 「地球上最聪明的 AI」。彼时,Grok-3 在发布会上展现出了极其强大的推理能力、逻辑应变能力、理解极度复杂物理知识以及空间模拟能力,当时在数学、科学和编程基准测试中超越了包括 Gemini 与 Claude、GPT-4o 在内的所有大模型竞品。
据了解,Grok 3 的诞生,标志着 AI 计算能力的全新时代。Grok 3 的训练规模堪称史无前例,xAI 公司动用了 20 万块英伟达 GPU,构建了全球最大的超算集群 Colossus。
这一训练过程分为两个阶段:第一阶段使用 10 万块 GPU,耗时 122 天;第二阶段扩展至 20 万块 GPU,耗时 92 天。如此庞大的算力投入,使得 Grok 3 的训练计算量达到前代 Grok-2 的 10 倍。
资料显示,Grok 3 的训练数据集极其庞大,包括了合成数据、公共网络数据以及专有数据,旨在增强模型的推理能力、解决复杂问题和理解人类语言的深度。马斯克在直播中强调,Grok 3 不仅是性能上的提升,更是一个在设计理念上的突破,它能够在推理过程中进行 「自我反思」,这意味着 AI 可以识别并纠正错误,从而减少 「幻觉」(hallucinations) 现象。
每日经济新闻综合界面新闻、证券时报
文章转载自 每经网