每经杭州 7 月 23 日电(记者叶晓丹)7 月 23 日清晨,阿里开源全新的通义千问 AI(人工智能) 编程大模型 Qwen3-Coder,编程能力登顶全球开源模型阵营,并超越 GPT4.1 等闭源模型,比肩全球最强的编程模型 Claude4。千问 3 编程模型在代码能力及 Agent(智能体) 调用能力方面取得重大突破。借助 Qwen3-Coder,刚入行的程序员一天就能完成资深程序员一周的工作,生成一个品牌官网最快只需 5 分钟。
Qwen3-Coder 是千问系列模型中首个采用混合专家 MoE 架构的代码模型,总参数达 480B,激活 35B 参数,原生支持 256K token 的上下文并可扩展至 1M 长度。Qwen3-Coder 在代码占比 70% 的 7.5T 数据上预训练,在后训练阶段进行了编程任务及智能体任务的强化学习,最终实现了通用能力、代码能力及 Agent 能力的飞升:在浏览器调用 (WebArena)、工具调用 (BFCL) 等 Agent 能力评测中,Qwen3-Coder 刷新开源模型纪录,超越 GPT4.1;在考察模型自主规划解决编程任务的 SWE-Bench 评测中,Qwen3-Coder 取得了开源最佳效果,可媲美 Claude4。
文章转载自 每经网