• 最新
  • 热门
  • 所有
  • 外汇
  • 24 小时
  • 期货
  • 基金
  • 贵金属
  • 股票
通义千问开源Qwen2.5大模型,性能超越Llama

通义千问开源 Qwen2.5 大模型,性能超越 Llama

2024 年 9 月 22 日

三大指数集体收跌,超 20 只基金单日跌逾 4%

2026 年 1 月 21 日

美财长贝森特呼吁冷静,驳斥欧洲将 「清仓」 美债报复特朗普

2026 年 1 月 21 日
部分宽基ETF继续放量成交 资金流向传递重要信号!

部分宽基 ETF 继续放量成交 资金流向传递重要信号!

2026 年 1 月 21 日
广告
多家上市公司宣布:去年业绩大爆发!

多家上市公司宣布:去年业绩大爆发!

2026 年 1 月 21 日
特朗普:不会参加七国集团峰会!欧洲议会冻结美欧贸易协议批准程序!

特朗普:不会参加七国集团峰会!欧洲议会冻结美欧贸易协议批准程序!

2026 年 1 月 21 日
特朗普:若关税工具受限 还可采用其他手段 不排除以武力夺取格陵兰岛可能性!

特朗普:若关税工具受限 还可采用其他手段 不排除以武力夺取格陵兰岛可能性!

2026 年 1 月 21 日
金、银、铜、铝集体走强 上期所密集出台措施防市场过热

金、银、铜、铝集体走强 上期所密集出台措施防市场过热

2026 年 1 月 21 日
会谈约2小时,俄美两国总统特使讨论乌克兰和平计划!俄军对乌军实施大规模打击!切尔诺贝利核电站最新消息

会谈约 2 小时,俄美两国总统特使讨论乌克兰和平计划!俄军对乌军实施大规模打击!切尔诺贝利核电站最新消息

2026 年 1 月 21 日
东方财富期货早餐 1月21日 周三

东方财富期货早餐 1 月 21 日 周三

2026 年 1 月 21 日

四大证券报精华摘要:1 月 21 日

2026 年 1 月 21 日
特朗普「格陵兰野心」引爆避险狂潮!金价狂飙冲破4730美元

特朗普 「格陵兰野心」 引爆避险狂潮!金价狂飙冲破 4730 美元

2026 年 1 月 21 日
公募四季报揭秘:有基金规模环比「飞升」4200% 跟不跟?

公募四季报揭秘:有基金规模环比 「飞升」4200% 跟不跟?

2026 年 1 月 21 日
金桂财经
广告
2026 年 1 月 21 日 星期三
联系我们
合作建议
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
  • 登录& 注册
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
没有结果
查看所有结果
金桂财经
没有结果
查看所有结果

通义千问开源 Qwen2.5 大模型,性能超越 Llama

来自 金桂财经
2024 年 9 月 22 日
在 科技
0


【TechWeb】9 月 19 日消息,2024 云栖大会上,阿里云 CTO 周靖人发布通义千问新一代开源模型 Qwen2.5,旗舰模型 Qwen2.5-72B 性能超越 Llama 405B,再登全球开源大模型王座。

YOU MAY ALSO LIKE

云文档查找工具——Notion/Obsidian/飞书/语雀/FlowUS…公开文档一键直达!

TechWeb 微晚报:马斯克身家接近 7800 亿美元,小米汽车一天两起火情

Qwen2.5 全系列涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架 100 多个模型,刷新业界纪录。

据介绍,Qwen2.5 全系列模型都在 18T tokens 数据上进行预训练,相比 Qwen2,整体性能提升 18% 以上,拥有更多的知识、更强的编程和数学能力。Qwen2.5-72B 模型在 MMLU-rudex 基准 (考察通用知识)、MBPP 基准 (考察代码能力) 和 MATH 基准 (考察数学能力) 的得分高达 86.8、88.2、83.1。

Qwen2.5 支持高达 128K 的上下文长度,可生成最多 8K 内容。模型拥有强大的多语言能力,支持中文、英文、法文、西班牙文、俄文、日文、越南文、阿拉伯文等 29 种以上语言。模型能够丝滑响应多样化的系统提示,实现角色扮演和聊天机器人等任务。在指令跟随、理解结构化数据 (如表格)、生成结构化输出 (尤其是 JSON) 等方面 Qwen2.5 都进步明显。

语言模型方面,Qwen2.5 开源了 7 个尺寸,0.5B、1.5B、3B、7B、14B、32B、72B,它们在同等参数赛道都创造了业界最佳成绩,型号设定充分考虑下游场景的不同需求,3B 是适配手机等端侧设备的黄金尺寸;32B 是最受开发者期待的 「性价比之王」,可在性能和功耗之间获得最佳平衡,Qwen2.5-32B 的整体表现超越了 Qwen2-72B。

在 MMLU-redux 等十多个基准测评中,Qwen2.5-72B 表现超越 Llama3.1-405B

72B 是 Qwen2.5 系列的旗舰模型,其指令跟随版本 Qwen2.5-72B-Instruct 在 MMLU-redux、MATH、MBPP、LiveCodeBench、Arena-Hard、AlignBench、MT-Bench、MultiPL-E 等权威测评中表现出色,在多个核心任务上,以不到 1/5 的参数超越了拥有 4050 亿巨量参数的 Llama3.1-405B,继续稳居 「全球最强开源大模型」 的位置。

专项模型方面,用于编程的 Qwen2.5-Coder 和用于数学的 Qwen2.5-Math 都比前代有了实质性进步。Qwen2.5-Coder 在多达 5.5T tokens 的编程相关数据上作了训练,当天开源 1.5B 和 7B 版本,未来还将开源 32B 版本;Qwen2.5-Math 支持使用思维链和工具集成推理 (TIR) 解决中英双语的数学题,是迄今为止最先进的开源数学模型系列,本次开源了 1.5B、7B、72B 三个尺寸和一款数学奖励模型 Qwen2.5-Math-RM。

多模态模型方面,广受期待的视觉语言模型 Qwen2-VL-72B 正式开源,Qwen2-VL 能识别不同分辨率和长宽比的图片,理解 20 分钟以上长视频,具备自主操作手机和机器人的视觉智能体能力。日前权威测评 LMSYS Chatbot Arena Leaderboard 发布最新一期的视觉模型性能测评结果,Qwen2-VL-72B 成为全球得分最高的开源模型。


Qwen2-VL-72B 在权威测评 LMSYS Chatbot Arena Leaderboard 成为成为全球得分最高的开源视觉理解模型

自从 2023 年 8 月开源以来,通义在全球开源大模型领域后来居上,成为开发者尤其是中国开发者的首选模型。性能上,通义大模型日拱一卒,逐步赶超美国最强开源模型 Llama,多次登顶 Hugging Face 全球大模型榜单;生态上,通义从零起步、开疆拓土,与海内外的开源社区、生态伙伴、开发者共建生态网络,截至 2024 年 9 月中旬,通义千问开源模型下载量突破 4000 万,Qwen 系列衍生模型总数超过 5 万个,成为仅次于 Llama 的世界级模型群。


HuggingFace 数据显示,截至 9 月中旬 Qwen 系列原生模型和衍生模型总数超过 5 万个

 



Search

没有结果
查看所有结果

一周热门

三大指数集体收跌,超 20 只基金单日跌逾 4%

2026 年 1 月 21 日

美财长贝森特呼吁冷静,驳斥欧洲将 「清仓」 美债报复特朗普

2026 年 1 月 21 日
部分宽基ETF继续放量成交 资金流向传递重要信号!

部分宽基 ETF 继续放量成交 资金流向传递重要信号!

2026 年 1 月 21 日
多家上市公司宣布:去年业绩大爆发!

多家上市公司宣布:去年业绩大爆发!

2026 年 1 月 21 日
特朗普:不会参加七国集团峰会!欧洲议会冻结美欧贸易协议批准程序!

特朗普:不会参加七国集团峰会!欧洲议会冻结美欧贸易协议批准程序!

2026 年 1 月 21 日
特朗普:若关税工具受限 还可采用其他手段 不排除以武力夺取格陵兰岛可能性!

特朗普:若关税工具受限 还可采用其他手段 不排除以武力夺取格陵兰岛可能性!

2026 年 1 月 21 日
金、银、铜、铝集体走强 上期所密集出台措施防市场过热

金、银、铜、铝集体走强 上期所密集出台措施防市场过热

2026 年 1 月 21 日
会谈约2小时,俄美两国总统特使讨论乌克兰和平计划!俄军对乌军实施大规模打击!切尔诺贝利核电站最新消息

会谈约 2 小时,俄美两国总统特使讨论乌克兰和平计划!俄军对乌军实施大规模打击!切尔诺贝利核电站最新消息

2026 年 1 月 21 日
东方财富期货早餐 1月21日 周三

东方财富期货早餐 1 月 21 日 周三

2026 年 1 月 21 日

四大证券报精华摘要:1 月 21 日

2026 年 1 月 21 日
金桂财经

2026 年 1 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 12 月    

近期动态

  • 三大指数集体收跌,超 20 只基金单日跌逾 4%
  • 美财长贝森特呼吁冷静,驳斥欧洲将 「清仓」 美债报复特朗普
  • 部分宽基 ETF 继续放量成交 资金流向传递重要信号!
  • 多家上市公司宣布:去年业绩大爆发!
  • 特朗普:不会参加七国集团峰会!欧洲议会冻结美欧贸易协议批准程序!
  • 特朗普:若关税工具受限 还可采用其他手段 不排除以武力夺取格陵兰岛可能性!
广告

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 关于本站
  • 联系我们
  • 隐私政策
没有结果
查看所有结果
  • 登录& 注册

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 登录
  • 注册
忘记密码?
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.
body::-webkit-scrollbar { width: 7px; } body::-webkit-scrollbar-track { border-radius: 10px; background: #f0f0f0; } body::-webkit-scrollbar-thumb { border-radius: 50px; background: #dfdbdb }