• 最新
  • 热门
  • 所有
  • 外汇
  • 24 小时
  • 期货
  • 基金
  • 贵金属
  • 股票
蚂蚁发布并开源万亿参数思考模型Ring-1T 综合能力逼近GPT-5

蚂蚁发布并开源万亿参数思考模型 Ring-1T 综合能力逼近 GPT-5

2025 年 10 月 14 日
焦煤期权在大商所挂牌上市

焦煤期权在大商所挂牌上市

2026 年 1 月 16 日
今夜,白银又爆了,再创历史新高!美股集体下挫,美最高法院未就特朗普政府关税合法性作出裁决

今夜,白银又爆了,再创历史新高!美股集体下挫,美最高法院未就特朗普政府关税合法性作出裁决

2026 年 1 月 16 日
特朗普 突变!「暂缓决定是否对伊朗发动军事打击」 美军基地警戒级别降低!油价大跌

特朗普 突变!「暂缓决定是否对伊朗发动军事打击」 美军基地警戒级别降低!油价大跌

2026 年 1 月 16 日
广告
生猪价格跌至年内新低 行业面临不同程度亏损

A 股 「吹哨人」 发声!三大信号闪现!

2026 年 1 月 16 日
生猪价格跌至年内新低 行业面临不同程度亏损

美军宣布成立 「黄金联合特遣部队」!美军此前突袭委内瑞拉动用这一神秘武器 通过聚焦能量来消灭目标

2026 年 1 月 16 日

短期波动不改长期趋势,持续关注 A500ETF 易方达 (159361) 等产品投资机会

2026 年 1 月 16 日

四大证券报精华摘要:1 月 16 日

2026 年 1 月 16 日
三箭齐发!上期所:调整锡期货交易保证金比例、涨跌停板幅度及交易限额

三箭齐发!上期所:调整锡期货交易保证金比例、涨跌停板幅度及交易限额

2026 年 1 月 16 日

「华尔街一哥」 警告:全球地缘与赤字风险共振,债务恶果迟早反噬!

2026 年 1 月 16 日
美国国防部5亿美元大单,一路推迟后突然取消!稀土、锂概念股暴跌

突发!美国将暂停对俄罗斯、巴西等 75 国所有签证!丹麦增兵格陵兰岛,特朗普:该岛对美国 「金穹」 系统至关重要

2026 年 1 月 16 日

「遇见」AI 这个冷门赛道开年大涨!基金经理也入场了

2026 年 1 月 16 日
4万亿电网投资已在路上 哪些企业有望受益?

4 万亿电网投资已在路上 哪些企业有望受益?

2026 年 1 月 16 日
金桂财经
广告
2026 年 1 月 16 日 星期五
联系我们
合作建议
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
  • 登录& 注册
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
没有结果
查看所有结果
金桂财经
没有结果
查看所有结果

蚂蚁发布并开源万亿参数思考模型 Ring-1T 综合能力逼近 GPT-5

来自 金桂财经
2025 年 10 月 14 日
在 科技
0

【文章来源:techweb】

【TechWeb】10 月 14 日消息,今天凌晨,蚂蚁集团正式推出万亿参数思考模型 Ring-1T,并全面开源模型权重、训练配方。

Ring-1T 在 9 月 30 日开源的预览版 Ring-1T-preview 基础上,持续扩展大规模可验证奖励强化学习 (RLVR) 训练,进一步激发万亿基座的自然语言推理能力,并通过 RLHF 训练完善模型通用能力,在各项任务榜单上表现更加均衡。

为了持续激发 Ring-1T 的数学等复杂推理能力,此次百灵团队挑战了难度更高的 IMO2025(国际数学奥利匹克) 赛题,将 Ring-1T 接入多智能体框架 AWorld,使用纯自然语言推理进行解题。实验结果显示,Ring-1T 仅用一次解出了第 1、3、4、5 题,相当于 IMO 银牌水平,成为首个能拿 IMO 国际奥数奖的开源系统。Ring-1T 在第三次尝试 IMO 时对第 2 题几何证明也给出了接近满分的证明过程,在顶流大模型几乎全军覆没的第六题中将答案收敛到与 Gemini 2.5 Pro 相同的 「4048」(正确答案为 2112)。

作为一款思考模型,Ring-1T 也表现出了很好的通用能力,在 「人类偏好对齐」 测试 Arena-Hard V2 中,Ring-1T 以 81.59 的成功率居于开源模型榜首,逼近 GPT-5-Thinking(High)82.91 的成绩。在面向严谨领域的医疗问答 HealthBench 测评中,Ring-1T 也以最高分取得开源领域最佳。

万亿参数思考模型训练最大难题是训推精度差异,即训练阶段与推理阶段因实现细节差异导致的训练和推理精度不一致,进而导致训练崩溃。据介绍,在 Ring-1T 模型中,蚂蚁采用了自研的 「棒冰 (icepop)」 算法来应对这项行业难题,即用带掩码的双向截断技术把训练-推理分布差异冻结在低水位,确保长序列、长周期训练不崩。

此外,应对万亿参数模型强化学习训练,蚂蚁还自研了高性能强化学习系统 ASystem(其中包含已开源的高性能强化学习框架 AReaL),特别针对万亿参数模型的显存管理和训推权重交换问题做了精细的优化,实现了单机显存碎片秒级回收、权重零冗余交换,把大规模 RL 训练稳定跑成日常。

据百灵团队透露,Ring-1T 模型是其在万亿思考模型上的首次尝试,蚂蚁百灵团队会在后续的版本中继续完善模型性能。目前,用户可通过 HuggingFace、魔搭社区下载模型,并通过蚂蚁百宝箱等平台在线体验。

最近,百灵团队动作频频,先是 9 月 30 日发布了 Ring-1T 的预览版 Ring-1T-preview,二者都是思考模型,也就是推理模型。10 月 9 日,蚂蚁集团发布了万亿参数通用大语言模型 Ling-1T,这个是非思考模型。

截至目前,蚂蚁百灵大模型已经发布 18 款模型,形成从 160 亿总参数到 1 万亿总参数的大语言模型产品矩阵,其中包括两款万亿参数模型:通用大语言模型 Ling-1T、思考模型 Ring-1T。 

【文章来源:techweb】

【TechWeb】10 月 14 日消息,今天凌晨,蚂蚁集团正式推出万亿参数思考模型 Ring-1T,并全面开源模型权重、训练配方。

Ring-1T 在 9 月 30 日开源的预览版 Ring-1T-preview 基础上,持续扩展大规模可验证奖励强化学习 (RLVR) 训练,进一步激发万亿基座的自然语言推理能力,并通过 RLHF 训练完善模型通用能力,在各项任务榜单上表现更加均衡。

为了持续激发 Ring-1T 的数学等复杂推理能力,此次百灵团队挑战了难度更高的 IMO2025(国际数学奥利匹克) 赛题,将 Ring-1T 接入多智能体框架 AWorld,使用纯自然语言推理进行解题。实验结果显示,Ring-1T 仅用一次解出了第 1、3、4、5 题,相当于 IMO 银牌水平,成为首个能拿 IMO 国际奥数奖的开源系统。Ring-1T 在第三次尝试 IMO 时对第 2 题几何证明也给出了接近满分的证明过程,在顶流大模型几乎全军覆没的第六题中将答案收敛到与 Gemini 2.5 Pro 相同的 「4048」(正确答案为 2112)。

作为一款思考模型,Ring-1T 也表现出了很好的通用能力,在 「人类偏好对齐」 测试 Arena-Hard V2 中,Ring-1T 以 81.59 的成功率居于开源模型榜首,逼近 GPT-5-Thinking(High)82.91 的成绩。在面向严谨领域的医疗问答 HealthBench 测评中,Ring-1T 也以最高分取得开源领域最佳。

万亿参数思考模型训练最大难题是训推精度差异,即训练阶段与推理阶段因实现细节差异导致的训练和推理精度不一致,进而导致训练崩溃。据介绍,在 Ring-1T 模型中,蚂蚁采用了自研的 「棒冰 (icepop)」 算法来应对这项行业难题,即用带掩码的双向截断技术把训练-推理分布差异冻结在低水位,确保长序列、长周期训练不崩。

此外,应对万亿参数模型强化学习训练,蚂蚁还自研了高性能强化学习系统 ASystem(其中包含已开源的高性能强化学习框架 AReaL),特别针对万亿参数模型的显存管理和训推权重交换问题做了精细的优化,实现了单机显存碎片秒级回收、权重零冗余交换,把大规模 RL 训练稳定跑成日常。

据百灵团队透露,Ring-1T 模型是其在万亿思考模型上的首次尝试,蚂蚁百灵团队会在后续的版本中继续完善模型性能。目前,用户可通过 HuggingFace、魔搭社区下载模型,并通过蚂蚁百宝箱等平台在线体验。

最近,百灵团队动作频频,先是 9 月 30 日发布了 Ring-1T 的预览版 Ring-1T-preview,二者都是思考模型,也就是推理模型。10 月 9 日,蚂蚁集团发布了万亿参数通用大语言模型 Ling-1T,这个是非思考模型。

截至目前,蚂蚁百灵大模型已经发布 18 款模型,形成从 160 亿总参数到 1 万亿总参数的大语言模型产品矩阵,其中包括两款万亿参数模型:通用大语言模型 Ling-1T、思考模型 Ring-1T。 

YOU MAY ALSO LIKE

FileCompare (https://filecompare.org) 让数据差异一目了然!

QQ 官方回应沈腾空间被盗传闻:非盗号,是腾哥的来时路

【文章来源:techweb】

【TechWeb】10 月 14 日消息,今天凌晨,蚂蚁集团正式推出万亿参数思考模型 Ring-1T,并全面开源模型权重、训练配方。

Ring-1T 在 9 月 30 日开源的预览版 Ring-1T-preview 基础上,持续扩展大规模可验证奖励强化学习 (RLVR) 训练,进一步激发万亿基座的自然语言推理能力,并通过 RLHF 训练完善模型通用能力,在各项任务榜单上表现更加均衡。

为了持续激发 Ring-1T 的数学等复杂推理能力,此次百灵团队挑战了难度更高的 IMO2025(国际数学奥利匹克) 赛题,将 Ring-1T 接入多智能体框架 AWorld,使用纯自然语言推理进行解题。实验结果显示,Ring-1T 仅用一次解出了第 1、3、4、5 题,相当于 IMO 银牌水平,成为首个能拿 IMO 国际奥数奖的开源系统。Ring-1T 在第三次尝试 IMO 时对第 2 题几何证明也给出了接近满分的证明过程,在顶流大模型几乎全军覆没的第六题中将答案收敛到与 Gemini 2.5 Pro 相同的 「4048」(正确答案为 2112)。

作为一款思考模型,Ring-1T 也表现出了很好的通用能力,在 「人类偏好对齐」 测试 Arena-Hard V2 中,Ring-1T 以 81.59 的成功率居于开源模型榜首,逼近 GPT-5-Thinking(High)82.91 的成绩。在面向严谨领域的医疗问答 HealthBench 测评中,Ring-1T 也以最高分取得开源领域最佳。

万亿参数思考模型训练最大难题是训推精度差异,即训练阶段与推理阶段因实现细节差异导致的训练和推理精度不一致,进而导致训练崩溃。据介绍,在 Ring-1T 模型中,蚂蚁采用了自研的 「棒冰 (icepop)」 算法来应对这项行业难题,即用带掩码的双向截断技术把训练-推理分布差异冻结在低水位,确保长序列、长周期训练不崩。

此外,应对万亿参数模型强化学习训练,蚂蚁还自研了高性能强化学习系统 ASystem(其中包含已开源的高性能强化学习框架 AReaL),特别针对万亿参数模型的显存管理和训推权重交换问题做了精细的优化,实现了单机显存碎片秒级回收、权重零冗余交换,把大规模 RL 训练稳定跑成日常。

据百灵团队透露,Ring-1T 模型是其在万亿思考模型上的首次尝试,蚂蚁百灵团队会在后续的版本中继续完善模型性能。目前,用户可通过 HuggingFace、魔搭社区下载模型,并通过蚂蚁百宝箱等平台在线体验。

最近,百灵团队动作频频,先是 9 月 30 日发布了 Ring-1T 的预览版 Ring-1T-preview,二者都是思考模型,也就是推理模型。10 月 9 日,蚂蚁集团发布了万亿参数通用大语言模型 Ling-1T,这个是非思考模型。

截至目前,蚂蚁百灵大模型已经发布 18 款模型,形成从 160 亿总参数到 1 万亿总参数的大语言模型产品矩阵,其中包括两款万亿参数模型:通用大语言模型 Ling-1T、思考模型 Ring-1T。 

【文章来源:techweb】

【TechWeb】10 月 14 日消息,今天凌晨,蚂蚁集团正式推出万亿参数思考模型 Ring-1T,并全面开源模型权重、训练配方。

Ring-1T 在 9 月 30 日开源的预览版 Ring-1T-preview 基础上,持续扩展大规模可验证奖励强化学习 (RLVR) 训练,进一步激发万亿基座的自然语言推理能力,并通过 RLHF 训练完善模型通用能力,在各项任务榜单上表现更加均衡。

为了持续激发 Ring-1T 的数学等复杂推理能力,此次百灵团队挑战了难度更高的 IMO2025(国际数学奥利匹克) 赛题,将 Ring-1T 接入多智能体框架 AWorld,使用纯自然语言推理进行解题。实验结果显示,Ring-1T 仅用一次解出了第 1、3、4、5 题,相当于 IMO 银牌水平,成为首个能拿 IMO 国际奥数奖的开源系统。Ring-1T 在第三次尝试 IMO 时对第 2 题几何证明也给出了接近满分的证明过程,在顶流大模型几乎全军覆没的第六题中将答案收敛到与 Gemini 2.5 Pro 相同的 「4048」(正确答案为 2112)。

作为一款思考模型,Ring-1T 也表现出了很好的通用能力,在 「人类偏好对齐」 测试 Arena-Hard V2 中,Ring-1T 以 81.59 的成功率居于开源模型榜首,逼近 GPT-5-Thinking(High)82.91 的成绩。在面向严谨领域的医疗问答 HealthBench 测评中,Ring-1T 也以最高分取得开源领域最佳。

万亿参数思考模型训练最大难题是训推精度差异,即训练阶段与推理阶段因实现细节差异导致的训练和推理精度不一致,进而导致训练崩溃。据介绍,在 Ring-1T 模型中,蚂蚁采用了自研的 「棒冰 (icepop)」 算法来应对这项行业难题,即用带掩码的双向截断技术把训练-推理分布差异冻结在低水位,确保长序列、长周期训练不崩。

此外,应对万亿参数模型强化学习训练,蚂蚁还自研了高性能强化学习系统 ASystem(其中包含已开源的高性能强化学习框架 AReaL),特别针对万亿参数模型的显存管理和训推权重交换问题做了精细的优化,实现了单机显存碎片秒级回收、权重零冗余交换,把大规模 RL 训练稳定跑成日常。

据百灵团队透露,Ring-1T 模型是其在万亿思考模型上的首次尝试,蚂蚁百灵团队会在后续的版本中继续完善模型性能。目前,用户可通过 HuggingFace、魔搭社区下载模型,并通过蚂蚁百宝箱等平台在线体验。

最近,百灵团队动作频频,先是 9 月 30 日发布了 Ring-1T 的预览版 Ring-1T-preview,二者都是思考模型,也就是推理模型。10 月 9 日,蚂蚁集团发布了万亿参数通用大语言模型 Ling-1T,这个是非思考模型。

截至目前,蚂蚁百灵大模型已经发布 18 款模型,形成从 160 亿总参数到 1 万亿总参数的大语言模型产品矩阵,其中包括两款万亿参数模型:通用大语言模型 Ling-1T、思考模型 Ring-1T。 

Search

没有结果
查看所有结果

一周热门

焦煤期权在大商所挂牌上市

焦煤期权在大商所挂牌上市

2026 年 1 月 16 日
今夜,白银又爆了,再创历史新高!美股集体下挫,美最高法院未就特朗普政府关税合法性作出裁决

今夜,白银又爆了,再创历史新高!美股集体下挫,美最高法院未就特朗普政府关税合法性作出裁决

2026 年 1 月 16 日
特朗普 突变!「暂缓决定是否对伊朗发动军事打击」 美军基地警戒级别降低!油价大跌

特朗普 突变!「暂缓决定是否对伊朗发动军事打击」 美军基地警戒级别降低!油价大跌

2026 年 1 月 16 日
生猪价格跌至年内新低 行业面临不同程度亏损

A 股 「吹哨人」 发声!三大信号闪现!

2026 年 1 月 16 日
生猪价格跌至年内新低 行业面临不同程度亏损

美军宣布成立 「黄金联合特遣部队」!美军此前突袭委内瑞拉动用这一神秘武器 通过聚焦能量来消灭目标

2026 年 1 月 16 日

短期波动不改长期趋势,持续关注 A500ETF 易方达 (159361) 等产品投资机会

2026 年 1 月 16 日

四大证券报精华摘要:1 月 16 日

2026 年 1 月 16 日
三箭齐发!上期所:调整锡期货交易保证金比例、涨跌停板幅度及交易限额

三箭齐发!上期所:调整锡期货交易保证金比例、涨跌停板幅度及交易限额

2026 年 1 月 16 日

「华尔街一哥」 警告:全球地缘与赤字风险共振,债务恶果迟早反噬!

2026 年 1 月 16 日
美国国防部5亿美元大单,一路推迟后突然取消!稀土、锂概念股暴跌

突发!美国将暂停对俄罗斯、巴西等 75 国所有签证!丹麦增兵格陵兰岛,特朗普:该岛对美国 「金穹」 系统至关重要

2026 年 1 月 16 日
金桂财经

2026 年 1 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 12 月    

近期动态

  • 焦煤期权在大商所挂牌上市
  • 今夜,白银又爆了,再创历史新高!美股集体下挫,美最高法院未就特朗普政府关税合法性作出裁决
  • 特朗普 突变!「暂缓决定是否对伊朗发动军事打击」 美军基地警戒级别降低!油价大跌
  • A 股 「吹哨人」 发声!三大信号闪现!
  • 美军宣布成立 「黄金联合特遣部队」!美军此前突袭委内瑞拉动用这一神秘武器 通过聚焦能量来消灭目标
  • 短期波动不改长期趋势,持续关注 A500ETF 易方达 (159361) 等产品投资机会
广告

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 关于本站
  • 联系我们
  • 隐私政策
没有结果
查看所有结果
  • 登录& 注册

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 登录
  • 注册
忘记密码?
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.
body::-webkit-scrollbar { width: 7px; } body::-webkit-scrollbar-track { border-radius: 10px; background: #f0f0f0; } body::-webkit-scrollbar-thumb { border-radius: 50px; background: #dfdbdb }