Deepseek、智谱、MiniMax，集体宣布上新

中国 AI 大模型领域动态不断。2 月 11 日智谱确认「Pony Alpha」为其新模型 GLM-5，已在平台上线；此前该模型因能力强引开发者关注。1 月 8 日智谱挂牌上市，宣布回归基础模型研究。此外，DeepSeek 更新模型，支持百万 Token 上下文长度，还将推新一代旗舰模型；其团队发表两篇论文公开创新架构。同日，MiniMax 的 M2.5 模型也即将正式上线。

每经编辑｜毕陆名

蔚蓝锂芯终止参与格林美印尼项目增资扩股；时代电气已注意到固态变压器潜在市场需求 | 新能源早参

国家卫健委等 11 部门联合印发《国家基本药物目录管理办法》；瑞博生物与 Madrigal 达成 44 亿美元全球独家许可协议丨医药早参

中国 AI 大模型的重磅消息陆续传来。

2 月 11 日晚，智谱官方确认，此前在全球模型服务平台 OpenRouter 登顶热度榜首的神秘模型「Pony Alpha」，为智谱新模型 GLM-5。目前新模型已在 chat.z.ai 平台上线。

2 月 6 日，全球模型服务平台 OpenRouter 悄然上线一款代号为"Pony Alpha"的匿名模型，因其较强的编码能力、超长上下文窗口及针对智能体工作流的深度优化，迅速引发开发者社区关注，在海外社区热度迅速攀升。

OpenRouter 官方将 Pony Alpha 描述为「前沿基础模型」，在编程、智能体工作流、推理及角色扮演方面表现强劲，特别强调其「极高的工具调用准确率」。这一特性使其在 AI Agent（智能体）应用场景中展现出显著优势，开发者可通过 Claude Code 等工具调用该模型，实现长达数小时的复杂项目开发。

1 月 8 日，智谱正式在港交所挂牌上市，在挂牌当日，公司首席科学家、清华大学计算机系教授唐杰向全员发出内部信，确认新一代基座模型 GLM-5「即将发布」，并宣布 2026 年起「全面回归基础模型研究」，同时设立前沿创新部门 X-Lab，聚焦架构、学习范式与持续进化三大方向。

此外，DeepSeek 也更新了模型。据报道，多名用户反馈，DeepSeek 在网页端和 APP 端进行了版本更新，支持最高 1M（百万）Token 的上下文长度。而去年 8 月发布的 DeepSeekV3.1 上下文长度拓展至 128K。

目前，能将上下文推至百万级别的模型较少，谷歌的 Gemini 系列和 Anthropic 的 Claude Opus 4.6 等已率先实现。

DeepSeek 的 V 系列模型定位为追求极致综合性能的基础模型。2024 年 12 月推出的基础模型 V3 是 DeepSeek 的重要里程碑，其高效的 MoE 架构确立了强大的综合性能基础。此后，DeepSeek 在 V3 基础上快速迭代，发布了强化推理与 Agent（智能体）能力的 V3.1，并于 2025 年 12 月推出了最新正式版 V3.2。同时，还推出了一个专注于攻克高难度数学和学术问题的特殊版本 V3.2-Speciale。

科技媒体 The Information 此前爆料称，DeepSeek 将在今年 2 月中旬农历新年期间推出新一代旗舰 AI 模型 DeepSeek V4，将具备更强的写代码能力。

今年初，DeepSeek 团队发表两篇论文，公开了两项创新架构：mHC（流形约束超连接）用来优化深层 Transformer 信息流动，使模型训练更稳定、易扩展，在不增加算力负担前提下提升性能；Engram（条件记忆模块）将静态知识与动态计算解耦，用廉价 DRAM 存储实体知识，释放昂贵 HBM 专注推理，显著降低长上下文推理成本。

同日，MiniMax 也有消息传来，M2.5 模型即将正式上线，目前 MiniMax M2.5 模型已在海外的 MiniMax Agent 产品进行内测。

每日经济新闻综合公开信息

封面图片来源：AIGC

文章转载自每经网

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28