来源:
证券时报
作为 AI 智能体的 「黑马」,Manus 的爆火一度让外界对其充满期待。但经过数月的摸索,Manus「折戟」 中国市场。7 月 19 日,Manus 创始人罕见发声,首次公开回应了这次起落背后的一切。
7 月 19 日,Manus 联合创始人季逸超发布了一篇长博客,从技术层面深度复盘从创业以来在 Agent(智能体) 研发与训练方面的经验教训。季逸超表示,Manus 团队之所以选择 「套壳」 而非自研大模型,正是基于前一次创业的惨痛教训,决定基于开源或商业大模型做 「上下文工程」,构建智能体。然而,这个过程并不简单,团队经历了 4 次智能体框架调整才实现局部最优解。
通过回溯过去几个月的创业历程,季逸超为智能体赛道创业者总结了一系列的经验。他指出,AI 智能体的未来在于上下文设计,而非单纯比拼模型能力。值得注意的是,最近 AI 智能体领域迎来了不少新进展,OpenAI 推出了 ChatGPT 智能体系统,Kimi 发布了最新的大模型 K2,并表示 K2 的设计目标是 「为下一代智能体提供通用认知引擎」。在基础模型厂商凭借底层模型发力智能体赛道的背景下,纯智能体创业公司如何在激烈的竞争中立足,成为 Manus 不得不思考的问题。
从技术层面深度复盘 Manus 经验教训
今年 3 月,一款名为 Manus 的产品刷屏网络。这款产品由一家名为 「蝴蝶效应」 的初创公司研发,被称为 「全球第一款通用 Agent 产品」,能够实现真正的自主执行能力,完成筛选简历、做房产研究、股票分析等复杂任务。
一夜爆火后,Manus 的内测邀请码 「一码难求」,在二手平台上甚至被爆炒至数万元。然而不到半年时间,Manus 就被爆出撤离中国市场的消息,不仅官方微博和小红书账号的内容均已清空,官网首页也显示 「Manus 在你所在的地区不可用」。此外,还有消息称 Manus 已将总部迁往新加坡,除了核心研发团队 40 多人迁往新加坡,其余约 80 名非核心员工被裁。对此,Manus 对外回应表示:「基于公司自身经营效率考量,我们决定对部分业务团队进行调整。公司将继续专注核心业务发展,提升整体运营效率。」
从智能体的 「当红炸子鸡」 到撤离中国市场,Manus 一直饱受行业争议,外界对其这一选择也存在诸多猜测。7 月 19 日,Manus 联合创始人季逸超发布了一篇长博客,从技术层面深度复盘创业以来在 Agent(智能体) 研发与训练方面的经验教训,试图将舆论拉回到技术与产品本身。
在长文中,季逸超表示在 Manus 项目的最初阶段,他和他的团队就面临一个关键决定:是使用开源基础模型训练一个端到端的智能体,还是基于前沿模型的上下文学习能力构建一个智能体?季逸超说,在他的上一段创业经历中,他从头开始训练模型,但随着 GPT-3 和 Flan-T5 的出现,其内部模型 「一夜之间变得无关紧要」。正是因为有了这样的惨痛教训,Manus 选择押注于上下文工程而非底层模型,这也使得 Manus 能快速地改进,进行产品迭代。
具体来看,季逸超总结了 Manus 的不少实操经验,为业内同行提供了重要参考。比如,他强调 KV-Cache(Key-Value Cache,一种缓存机制) 的命中率至关重要,输入越稳定,缓存命中率越高,成本和延迟越低。因此,创业者有三种办法可以提高 KV-Cache 缓存命中率:一是保持提示前缀稳定,避免在提示中使用时间戳;二是使上下文仅追加,避免修改先前的操作或观察,确保序列化是确定性的;三是在需要时明确标记缓存断点。
此外,季逸超还提到,动态修改工具列表会让缓存失效、模型混乱,因此不要动态添加工具,而是要使用 「遮蔽法」 来控制选择;要用文件系统承载持久上下文,规避信息丢失;要保留错误日志 (如失败的操作、堆栈信息),帮助模型更新内部信念,减少重复错误等。
并未直接回应撤离中国市场原因
值得注意的是,季逸超的长文主要是技术层面的复盘与探讨,但并未对市场关注的裁员、迁址新加坡、撤离中国市场等话题进行直接回应。
Manus 虽然此前在国内引发了不少关注,但 Manus 从创业之初就有着极强的海外市场基因。发布之初,Manus 就仅仅支持英文,发布视频也是全程英文介绍,还需要特殊的网络条件进行注册。据了解,Manus 的核心基础是 Claude 大模型,这是美国创业公司 Anthropic 推出的一款大语言模型,而 Anthropic 是 OpenAI 最强劲的竞争对手之一。
此外,今年 4 月,Manus 母公司 「蝴蝶效应」 还完成了硅谷知名风投 Benchmark 牵头,腾讯、真格基金、HSG 跟投的 7500 万美元 B 轮融资,主要用于扩张美国、日本、中东等海外市场。
业内人士表示,Manus 最初就是瞄准了海外市场,但在国内的意外爆火使其开始萌生同时开拓国内市场的想法。Manus 受到国内用户关注后,曾宣布与阿里通义千问团队达成战略合作,双方将基于通义千问系列开源模型,致力于在国产模型和算力平台上实现 Manus 的全部功能。不过,Manus 与通义千问的合作始终没有落地,用户注册 Manus 依然需要特殊的网络条件。
外界对于 Manus 撤出中国市场有诸多猜测。有分析人士指出,Manus 的 B 轮融资由美国风投公司 Benchmark 领投,而美国 「对外投资安全计划」 禁止美国资本投资可能增强中国 AI 技术的项目,Manus 将总部迁至新加坡或是为了规避审查风险。此外,由于 Manus 主要基于 Claude 模型,而 Claude 模型不向国内用户提供服务,即使与阿里通义千问合作,也面临维护两套不同产品、成本高、投入产出不成正比等问题。这些原因,或都是其做出这一战略调整的主要考量。
AI 智能体赛道持续升温加速落地
在 Manus 引发行业对 「智能体退潮」 的忧虑时,近期 AI 智能体赛道却迎来了颇多重磅消息和重要技术进展。
7 月 18 日,OpenAI 推出了全新智能体产品 「ChatGPT Agent」。根据介绍,这是一个融合 Operator 智能体网页交互能力、含 「深度研究」(Deep Research) 功能的互联网信息搜集能力以及 ChatGPT 对话能力的统一智能体,可以完成包括在线购物、订餐预约、撰写研究报告、制作 PPT 和财务分析在内的多步骤复杂任务。
三者组成强力 「AI 三剑客」,标志着 OpenAI 全面进军自动化 AI 代理领域。值得注意的是,这一智能体产品的底层模型在多个基准测试中提供了最先进的性能,在涵盖超百个学科的 Humanity' s Last Exam(人类的最后测试) 中,得分率达 41.6%,约是 OpenAI o3 和 o4-mini 得分的两倍;在 FrontierMath 数学基准测试中,使用工具时得分 27.4%,远超 o4-mini 的 6.3% 。
与此同时,Kimi 近期也开源了万亿参数的混合专家模型 K2。在 Kimi 公布的测评结果中, K2 在自主编程、工具调用和数学推理三个维度的表现上,都超过了同为开源模型的 DeepSeek-V3 和阿里 Qwen3。Kimi 团队还对外宣称,K2 的设计目标是 「为下一代智能体提供通用认知引擎」,其核心亮点是智能体的应用能力,在工具调用和智能体循环方面表现极为出色。
多家券商研报表示,随着各 AI 巨头发力智能体产品商业化,2025 年有望成为 AI Agent 元年。中金研报指出,基础大模型仍是决定 Agent 能力上限的关键,大模型的编程及智能体能力也是各家厂商竞争关注的焦点。C 端 Agent 具有更大的市场想象空间,因此也是大厂和创业公司更为聚焦的领域,无论是海外的 OpenAI、Google 还是国内的字节、阿里,以及 Manus、Genspark 等创业公司都在这一领域积极布局,近半年来产业进展显著。
不过,当前智能体类产品存在同质化严重、商业化路径不明等问题,在基础模型厂商凭借底层模型发力智能体赛道的背景下,纯智能体创业公司如何在激烈的竞争中立足,成为 Manus 不得不思考的问题。
(证券时报)
文章转载自东方财富