• 最新
  • 热门
  • 所有
  • 外汇
  • 24 小时
  • 期货
  • 基金
  • 贵金属
  • 股票
蚂蚁发布万亿参数旗舰模型 Ling-1T并开源

蚂蚁发布万亿参数旗舰模型 Ling-1T 并开源

2025 年 10 月 9 日
创业板指一周跌没6%!券商研判:中期调整已至 长期慢牛未改

创业板指一周跌没 6%!券商研判:中期调整已至 长期慢牛未改

2025 年 11 月 23 日
俄罗斯工程院最新通报:正在核查,郭伟外籍院士资格暂予中止!江科大首席科学家被打假,自称曾获得8000余万元研究经费

俄罗斯工程院最新通报:正在核查,郭伟外籍院士资格暂予中止!江科大首席科学家被打假,自称曾获得 8000 余万元研究经费

2025 年 11 月 23 日
生猪价格跌至年内新低 行业面临不同程度亏损

以史为鉴 本轮科技牛调整到哪了?高成长+高回撤+高 ROE 的优质科技股曝光

2025 年 11 月 23 日
广告

焦炭第四轮提涨落地!累计涨 220 元/吨 下游钢厂亏损面扩大

2025 年 11 月 23 日
奖金50万元的草书特等奖被取消,官方公告:个别评委做了手脚,行径恶劣!书法家延志超回应:已正式提出申诉

奖金 50 万元的草书特等奖被取消,官方公告:个别评委做了手脚,行径恶劣!书法家延志超回应:已正式提出申诉

2025 年 11 月 23 日

但斌 「晒单」 引热议:海外基金三年赚 138%,一年收益却遭质疑平庸?真相藏在持仓里

2025 年 11 月 23 日

但斌 「晒单」 引热议:海外基金三年赚 138%,一年收益却遭质疑平庸?真相藏在持仓里

2025 年 11 月 23 日
卫星通信产业拐点在即 机构扎堆看好15只概念股

卫星通信产业拐点在即 机构扎堆看好 15 只概念股

2025 年 11 月 23 日
从「突破10万」到「快速跌停」 碳酸锂急剧转向 后市怎么走?

从 「突破 10 万」 到 「快速跌停」 碳酸锂急剧转向 后市怎么走?

2025 年 11 月 23 日

每经热评 | 美股 AI 泡沫特征渐显,巨头撑起的繁荣有四重脆弱性

2025 年 11 月 23 日
激辩「AI泡沫论」!达利欧、「大空头」齐发声

激辩 「AI 泡沫论」!达利欧、「大空头」 齐发声

2025 年 11 月 23 日
银河证券:淡化非农就业数据扰动 12月美联储或「不想降」

银河证券:淡化非农就业数据扰动 12 月美联储或 「不想降」

2025 年 11 月 23 日
金桂财经
广告
2025 年 11 月 23 日 星期日
联系我们
合作建议
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
  • 登录& 注册
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
没有结果
查看所有结果
金桂财经
没有结果
查看所有结果

蚂蚁发布万亿参数旗舰模型 Ling-1T 并开源

来自 金桂财经
2025 年 10 月 9 日
在 科技
0

【文章来源:techweb】

【TechWeb】10 月 9 日消息,今天凌晨,蚂蚁集团发布万亿参数的通用语言模型 Ling-1T。Ling-1T 是蚂蚁百灵大模型 Ling 2.0 系列的第一款旗舰模型,也是蚂蚁百灵团队迄今为止推出的规模最大、能力最强的非思考大模型。

测评显示,在有限输出 Token 条件下,Ling-1T 于多项复杂推理基准中取得 SOTA 表现。另外,在代码生成、软件开发、竞赛数学、专业数学、逻辑推理等多项高难度基准测试上,Ling-1T 均取得领先成绩,多项指标位居开源模型的榜首。

以竞赛数学榜单 AIME 25 (American Invitation Math Examination 25) 为例,Ling-1T 以平均 4000+ Token 的消耗达到了 70.42% 的准确率,优于 Gemini-2.5-Pro(平均 5000+ Token,准确率 70.10%)。Ling-1T 用更少的 Token 实现了更高的准确率,展现出在推理精度和思考效率综合能力上的优势。

 

据蚂蚁百灵团队透露,Ling-1T 沿用 Ling 2.0 架构,在 20T+ tokens 高质量、高推理浓度的语料上完成预训练,支持最高 128K 上下文窗口,通过 「中训练+后训练」 的演进式思维链 (Evo-CoT) 提升模型高效思考和精准推理能力。

值得一提的是,Ling-1T 全程采用 FP8 混合精度训练 (部分技术已开源),是目前已知规模最大的使用 FP8 训练的基座模型。这一设计为训练带来了显著的显存节省、更灵活的并行切分策略和 15%+ 的端到端加速。

在强化学习阶段,蚂蚁百灵团队创提出了 LPO 方法 (Linguistics-Unit Policy Optimization,LingPO) ,这是一种以 「句子」 为粒度的策略优化算法,为万亿参数模型的稳定训练提供了关键支持。这种方法既避免了词元级别的破碎感,也克服了序列级别的笼统性,使得奖励信号与模型行为在语义层面实现了更精准的对齐。

另外,蚂蚁百灵团队提出了 「语法-功能-美学」 的混合奖励机制,在确保代码正确、功能完善的同时持续提升这个万亿基座对视觉美学的认知。在 ArtifactsBench 前端能力基准上,Ling-1T 得分 59.31,在可视化和前端开发任务领域,仅次于 Gemini-2.5-Pro-lowthink 的得分 60.28。

据了解,除了 Ling-1T 这款非思考模型,蚂蚁百灵团队还在训练万亿参数级的深度思考大模型 Ring-1T,已在 9 月 30 日开源了 preview 版。目前,开发者通过 Hugging Face 和蚂蚁百宝箱等平台都可以体验 Ling-1T 模型。

【文章来源:techweb】

【TechWeb】10 月 9 日消息,今天凌晨,蚂蚁集团发布万亿参数的通用语言模型 Ling-1T。Ling-1T 是蚂蚁百灵大模型 Ling 2.0 系列的第一款旗舰模型,也是蚂蚁百灵团队迄今为止推出的规模最大、能力最强的非思考大模型。

测评显示,在有限输出 Token 条件下,Ling-1T 于多项复杂推理基准中取得 SOTA 表现。另外,在代码生成、软件开发、竞赛数学、专业数学、逻辑推理等多项高难度基准测试上,Ling-1T 均取得领先成绩,多项指标位居开源模型的榜首。

以竞赛数学榜单 AIME 25 (American Invitation Math Examination 25) 为例,Ling-1T 以平均 4000+ Token 的消耗达到了 70.42% 的准确率,优于 Gemini-2.5-Pro(平均 5000+ Token,准确率 70.10%)。Ling-1T 用更少的 Token 实现了更高的准确率,展现出在推理精度和思考效率综合能力上的优势。

 

据蚂蚁百灵团队透露,Ling-1T 沿用 Ling 2.0 架构,在 20T+ tokens 高质量、高推理浓度的语料上完成预训练,支持最高 128K 上下文窗口,通过 「中训练+后训练」 的演进式思维链 (Evo-CoT) 提升模型高效思考和精准推理能力。

值得一提的是,Ling-1T 全程采用 FP8 混合精度训练 (部分技术已开源),是目前已知规模最大的使用 FP8 训练的基座模型。这一设计为训练带来了显著的显存节省、更灵活的并行切分策略和 15%+ 的端到端加速。

在强化学习阶段,蚂蚁百灵团队创提出了 LPO 方法 (Linguistics-Unit Policy Optimization,LingPO) ,这是一种以 「句子」 为粒度的策略优化算法,为万亿参数模型的稳定训练提供了关键支持。这种方法既避免了词元级别的破碎感,也克服了序列级别的笼统性,使得奖励信号与模型行为在语义层面实现了更精准的对齐。

另外,蚂蚁百灵团队提出了 「语法-功能-美学」 的混合奖励机制,在确保代码正确、功能完善的同时持续提升这个万亿基座对视觉美学的认知。在 ArtifactsBench 前端能力基准上,Ling-1T 得分 59.31,在可视化和前端开发任务领域,仅次于 Gemini-2.5-Pro-lowthink 的得分 60.28。

据了解,除了 Ling-1T 这款非思考模型,蚂蚁百灵团队还在训练万亿参数级的深度思考大模型 Ring-1T,已在 9 月 30 日开源了 preview 版。目前,开发者通过 Hugging Face 和蚂蚁百宝箱等平台都可以体验 Ling-1T 模型。

YOU MAY ALSO LIKE

第二届深圳网络文学征文大赛结果揭晓 张小花 《电子哪吒》 获特等奖

Gmail 被指 「拿用户邮件训练 AI」,谷歌否认

【文章来源:techweb】

【TechWeb】10 月 9 日消息,今天凌晨,蚂蚁集团发布万亿参数的通用语言模型 Ling-1T。Ling-1T 是蚂蚁百灵大模型 Ling 2.0 系列的第一款旗舰模型,也是蚂蚁百灵团队迄今为止推出的规模最大、能力最强的非思考大模型。

测评显示,在有限输出 Token 条件下,Ling-1T 于多项复杂推理基准中取得 SOTA 表现。另外,在代码生成、软件开发、竞赛数学、专业数学、逻辑推理等多项高难度基准测试上,Ling-1T 均取得领先成绩,多项指标位居开源模型的榜首。

以竞赛数学榜单 AIME 25 (American Invitation Math Examination 25) 为例,Ling-1T 以平均 4000+ Token 的消耗达到了 70.42% 的准确率,优于 Gemini-2.5-Pro(平均 5000+ Token,准确率 70.10%)。Ling-1T 用更少的 Token 实现了更高的准确率,展现出在推理精度和思考效率综合能力上的优势。

 

据蚂蚁百灵团队透露,Ling-1T 沿用 Ling 2.0 架构,在 20T+ tokens 高质量、高推理浓度的语料上完成预训练,支持最高 128K 上下文窗口,通过 「中训练+后训练」 的演进式思维链 (Evo-CoT) 提升模型高效思考和精准推理能力。

值得一提的是,Ling-1T 全程采用 FP8 混合精度训练 (部分技术已开源),是目前已知规模最大的使用 FP8 训练的基座模型。这一设计为训练带来了显著的显存节省、更灵活的并行切分策略和 15%+ 的端到端加速。

在强化学习阶段,蚂蚁百灵团队创提出了 LPO 方法 (Linguistics-Unit Policy Optimization,LingPO) ,这是一种以 「句子」 为粒度的策略优化算法,为万亿参数模型的稳定训练提供了关键支持。这种方法既避免了词元级别的破碎感,也克服了序列级别的笼统性,使得奖励信号与模型行为在语义层面实现了更精准的对齐。

另外,蚂蚁百灵团队提出了 「语法-功能-美学」 的混合奖励机制,在确保代码正确、功能完善的同时持续提升这个万亿基座对视觉美学的认知。在 ArtifactsBench 前端能力基准上,Ling-1T 得分 59.31,在可视化和前端开发任务领域,仅次于 Gemini-2.5-Pro-lowthink 的得分 60.28。

据了解,除了 Ling-1T 这款非思考模型,蚂蚁百灵团队还在训练万亿参数级的深度思考大模型 Ring-1T,已在 9 月 30 日开源了 preview 版。目前,开发者通过 Hugging Face 和蚂蚁百宝箱等平台都可以体验 Ling-1T 模型。

【文章来源:techweb】

【TechWeb】10 月 9 日消息,今天凌晨,蚂蚁集团发布万亿参数的通用语言模型 Ling-1T。Ling-1T 是蚂蚁百灵大模型 Ling 2.0 系列的第一款旗舰模型,也是蚂蚁百灵团队迄今为止推出的规模最大、能力最强的非思考大模型。

测评显示,在有限输出 Token 条件下,Ling-1T 于多项复杂推理基准中取得 SOTA 表现。另外,在代码生成、软件开发、竞赛数学、专业数学、逻辑推理等多项高难度基准测试上,Ling-1T 均取得领先成绩,多项指标位居开源模型的榜首。

以竞赛数学榜单 AIME 25 (American Invitation Math Examination 25) 为例,Ling-1T 以平均 4000+ Token 的消耗达到了 70.42% 的准确率,优于 Gemini-2.5-Pro(平均 5000+ Token,准确率 70.10%)。Ling-1T 用更少的 Token 实现了更高的准确率,展现出在推理精度和思考效率综合能力上的优势。

 

据蚂蚁百灵团队透露,Ling-1T 沿用 Ling 2.0 架构,在 20T+ tokens 高质量、高推理浓度的语料上完成预训练,支持最高 128K 上下文窗口,通过 「中训练+后训练」 的演进式思维链 (Evo-CoT) 提升模型高效思考和精准推理能力。

值得一提的是,Ling-1T 全程采用 FP8 混合精度训练 (部分技术已开源),是目前已知规模最大的使用 FP8 训练的基座模型。这一设计为训练带来了显著的显存节省、更灵活的并行切分策略和 15%+ 的端到端加速。

在强化学习阶段,蚂蚁百灵团队创提出了 LPO 方法 (Linguistics-Unit Policy Optimization,LingPO) ,这是一种以 「句子」 为粒度的策略优化算法,为万亿参数模型的稳定训练提供了关键支持。这种方法既避免了词元级别的破碎感,也克服了序列级别的笼统性,使得奖励信号与模型行为在语义层面实现了更精准的对齐。

另外,蚂蚁百灵团队提出了 「语法-功能-美学」 的混合奖励机制,在确保代码正确、功能完善的同时持续提升这个万亿基座对视觉美学的认知。在 ArtifactsBench 前端能力基准上,Ling-1T 得分 59.31,在可视化和前端开发任务领域,仅次于 Gemini-2.5-Pro-lowthink 的得分 60.28。

据了解,除了 Ling-1T 这款非思考模型,蚂蚁百灵团队还在训练万亿参数级的深度思考大模型 Ring-1T,已在 9 月 30 日开源了 preview 版。目前,开发者通过 Hugging Face 和蚂蚁百宝箱等平台都可以体验 Ling-1T 模型。

Search

没有结果
查看所有结果

一周热门

创业板指一周跌没6%!券商研判:中期调整已至 长期慢牛未改

创业板指一周跌没 6%!券商研判:中期调整已至 长期慢牛未改

2025 年 11 月 23 日
俄罗斯工程院最新通报:正在核查,郭伟外籍院士资格暂予中止!江科大首席科学家被打假,自称曾获得8000余万元研究经费

俄罗斯工程院最新通报:正在核查,郭伟外籍院士资格暂予中止!江科大首席科学家被打假,自称曾获得 8000 余万元研究经费

2025 年 11 月 23 日
生猪价格跌至年内新低 行业面临不同程度亏损

以史为鉴 本轮科技牛调整到哪了?高成长+高回撤+高 ROE 的优质科技股曝光

2025 年 11 月 23 日

焦炭第四轮提涨落地!累计涨 220 元/吨 下游钢厂亏损面扩大

2025 年 11 月 23 日
奖金50万元的草书特等奖被取消,官方公告:个别评委做了手脚,行径恶劣!书法家延志超回应:已正式提出申诉

奖金 50 万元的草书特等奖被取消,官方公告:个别评委做了手脚,行径恶劣!书法家延志超回应:已正式提出申诉

2025 年 11 月 23 日

但斌 「晒单」 引热议:海外基金三年赚 138%,一年收益却遭质疑平庸?真相藏在持仓里

2025 年 11 月 23 日

但斌 「晒单」 引热议:海外基金三年赚 138%,一年收益却遭质疑平庸?真相藏在持仓里

2025 年 11 月 23 日
卫星通信产业拐点在即 机构扎堆看好15只概念股

卫星通信产业拐点在即 机构扎堆看好 15 只概念股

2025 年 11 月 23 日
从「突破10万」到「快速跌停」 碳酸锂急剧转向 后市怎么走?

从 「突破 10 万」 到 「快速跌停」 碳酸锂急剧转向 后市怎么走?

2025 年 11 月 23 日

每经热评 | 美股 AI 泡沫特征渐显,巨头撑起的繁荣有四重脆弱性

2025 年 11 月 23 日
金桂财经

2025 年 11 月
一 二 三 四 五 六 日
 12
3456789
10111213141516
17181920212223
24252627282930
« 10 月    

近期动态

  • 创业板指一周跌没 6%!券商研判:中期调整已至 长期慢牛未改
  • 俄罗斯工程院最新通报:正在核查,郭伟外籍院士资格暂予中止!江科大首席科学家被打假,自称曾获得 8000 余万元研究经费
  • 以史为鉴 本轮科技牛调整到哪了?高成长+高回撤+高 ROE 的优质科技股曝光
  • 焦炭第四轮提涨落地!累计涨 220 元/吨 下游钢厂亏损面扩大
  • 奖金 50 万元的草书特等奖被取消,官方公告:个别评委做了手脚,行径恶劣!书法家延志超回应:已正式提出申诉
  • 但斌 「晒单」 引热议:海外基金三年赚 138%,一年收益却遭质疑平庸?真相藏在持仓里
广告

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 关于本站
  • 联系我们
  • 隐私政策
没有结果
查看所有结果
  • 登录& 注册

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 登录
  • 注册
忘记密码?
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.
body::-webkit-scrollbar { width: 7px; } body::-webkit-scrollbar-track { border-radius: 10px; background: #f0f0f0; } body::-webkit-scrollbar-thumb { border-radius: 50px; background: #dfdbdb }