• 最新
  • 热门
  • 所有
  • 外汇
  • 24 小时
  • 期货
  • 基金
  • 贵金属
  • 股票
开源即登顶!百度文心思考模型ERNIE-4.5-21B-A3B-Thinking登顶HuggingFace全球模型趋势榜

开源即登顶!百度文心思考模型 ERNIE-4.5-21B-A3B-Thinking 登顶 HuggingFace 全球模型趋势榜

2025 年 9 月 11 日
生猪价格跌至年内新低 行业面临不同程度亏损

100% 关税!美国突发威胁!事关芯片 韩国紧急回应!

2026 年 1 月 17 日
「星链」成地缘冲突工具,起底马斯克SpaceX的「吸金」逻辑;美联储主席人选生变;欧洲向格陵兰岛派兵,特朗普发声;金银比14年首次跌破50 | 一周国际财经

「星链」 成地缘冲突工具,起底马斯克 SpaceX 的 「吸金」 逻辑;美联储主席人选生变;欧洲向格陵兰岛派兵,特朗普发声;金银比 14 年首次跌破 50 | 一周国际财经

2026 年 1 月 17 日

关注证券 ETF(512880) 投资机会,券商板块迎来基本面与估值双重修复窗口期

2026 年 1 月 17 日
广告
生猪价格跌至年内新低 行业面临不同程度亏损

半导体材料重大突破!碳化硅龙头已抢先发力

2026 年 1 月 17 日
「星链」成地缘冲突工具,订阅规模4年半激增114倍!起底马斯克SpaceX「吸金」逻辑

「星链」 成地缘冲突工具,订阅规模 4 年半激增 114 倍!起底马斯克 SpaceX「吸金」 逻辑

2026 年 1 月 17 日

1 月 17 日晚间央视新闻联播要闻集锦

2026 年 1 月 17 日

违规分红迎强监管!基金以 「高比例分红」 为 「卖点」 协助投资者逃避税等行为,将被采取监管措施

2026 年 1 月 17 日

商务部美大司负责人解读中国加拿大经贸磋商成果

2026 年 1 月 17 日

国务院:支持消费新业态新模式新场景竞相涌现,制定实施城乡居民增收计划

2026 年 1 月 17 日
央广财评丨坚持稳字当头 A股要的不是「疯牛」而是「长牛」

央广财评丨坚持稳字当头 A 股要的不是 「疯牛」 而是 「长牛」

2026 年 1 月 17 日

近 4 亿港元市值只花 4750 万港元就拿下,华立股份折价并购港股公司部分股权,公告前股价双双大涨

2026 年 1 月 17 日
新华财经晚报:到2035年科技教育生态系统全面构建

新华财经晚报:商业用房购房贷款最低首付款比例调整为不低于 30%

2026 年 1 月 17 日
金桂财经
广告
2026 年 1 月 17 日 星期六
联系我们
合作建议
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
  • 登录& 注册
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
没有结果
查看所有结果
金桂财经
没有结果
查看所有结果

开源即登顶!百度文心思考模型 ERNIE-4.5-21B-A3B-Thinking 登顶 HuggingFace 全球模型趋势榜

来自 金桂财经
2025 年 9 月 11 日
在 科技
0

【文章来源:techweb】

【TechWeb】9 月 11 日消息,在 9 日举办的 WAVE SUMMIT 深度学习开发者大会 2025 现场,百度开源最新的思考模型 ERNIE-4.5-21B-A3B-Thinking。

据 HuggingFace 官网数据,截至 2025 年 9 月 11 日,百度最新开源的文心思考模型 ERNIE-4.5-21B-A3B-Thinking,在 HuggingFace 文本模型趋势榜上排名第一,模型总榜排名第三。

ERNIE-4.5-21B-A3B-Thinking 采用了混合专家 (MoE) 架构,总参数规模达 21B,每个 token 激活 3B 参数,通过指令微调及强化学习训练。ERNIE-4.5-21B-A3B-Thinking 是在 ERNIE-4.5-21B-A3B 基础上训练的深度思考模型,支持 128K 的上下文窗口,适用于需要长上下文的复杂推理任务。该模型不仅在逻辑推理、数学、科学,代码与文本生成等需要人类专家的任务上实现了显著提升,还具备高效的工具调用能力,能够支持复杂任务的自动化处理。

ERNIE-4.5-21B-A3B-Thinking 作为一款 21B 总参数量,激活仅 3B 的轻量级模型,在各项测试中的表现紧追业界顶级大尺寸模型,以轻量级规模实现了接近 SOTA 的智能表现。

 

【文章来源:techweb】

【TechWeb】9 月 11 日消息,在 9 日举办的 WAVE SUMMIT 深度学习开发者大会 2025 现场,百度开源最新的思考模型 ERNIE-4.5-21B-A3B-Thinking。

据 HuggingFace 官网数据,截至 2025 年 9 月 11 日,百度最新开源的文心思考模型 ERNIE-4.5-21B-A3B-Thinking,在 HuggingFace 文本模型趋势榜上排名第一,模型总榜排名第三。

ERNIE-4.5-21B-A3B-Thinking 采用了混合专家 (MoE) 架构,总参数规模达 21B,每个 token 激活 3B 参数,通过指令微调及强化学习训练。ERNIE-4.5-21B-A3B-Thinking 是在 ERNIE-4.5-21B-A3B 基础上训练的深度思考模型,支持 128K 的上下文窗口,适用于需要长上下文的复杂推理任务。该模型不仅在逻辑推理、数学、科学,代码与文本生成等需要人类专家的任务上实现了显著提升,还具备高效的工具调用能力,能够支持复杂任务的自动化处理。

ERNIE-4.5-21B-A3B-Thinking 作为一款 21B 总参数量,激活仅 3B 的轻量级模型,在各项测试中的表现紧追业界顶级大尺寸模型,以轻量级规模实现了接近 SOTA 的智能表现。

 

YOU MAY ALSO LIKE

今日工具推荐 - FileCompress 文件压缩工具

AI 购物时代真的要来了?实测千问点外卖、订机票、买东西

【文章来源:techweb】

【TechWeb】9 月 11 日消息,在 9 日举办的 WAVE SUMMIT 深度学习开发者大会 2025 现场,百度开源最新的思考模型 ERNIE-4.5-21B-A3B-Thinking。

据 HuggingFace 官网数据,截至 2025 年 9 月 11 日,百度最新开源的文心思考模型 ERNIE-4.5-21B-A3B-Thinking,在 HuggingFace 文本模型趋势榜上排名第一,模型总榜排名第三。

ERNIE-4.5-21B-A3B-Thinking 采用了混合专家 (MoE) 架构,总参数规模达 21B,每个 token 激活 3B 参数,通过指令微调及强化学习训练。ERNIE-4.5-21B-A3B-Thinking 是在 ERNIE-4.5-21B-A3B 基础上训练的深度思考模型,支持 128K 的上下文窗口,适用于需要长上下文的复杂推理任务。该模型不仅在逻辑推理、数学、科学,代码与文本生成等需要人类专家的任务上实现了显著提升,还具备高效的工具调用能力,能够支持复杂任务的自动化处理。

ERNIE-4.5-21B-A3B-Thinking 作为一款 21B 总参数量,激活仅 3B 的轻量级模型,在各项测试中的表现紧追业界顶级大尺寸模型,以轻量级规模实现了接近 SOTA 的智能表现。

 

【文章来源:techweb】

【TechWeb】9 月 11 日消息,在 9 日举办的 WAVE SUMMIT 深度学习开发者大会 2025 现场,百度开源最新的思考模型 ERNIE-4.5-21B-A3B-Thinking。

据 HuggingFace 官网数据,截至 2025 年 9 月 11 日,百度最新开源的文心思考模型 ERNIE-4.5-21B-A3B-Thinking,在 HuggingFace 文本模型趋势榜上排名第一,模型总榜排名第三。

ERNIE-4.5-21B-A3B-Thinking 采用了混合专家 (MoE) 架构,总参数规模达 21B,每个 token 激活 3B 参数,通过指令微调及强化学习训练。ERNIE-4.5-21B-A3B-Thinking 是在 ERNIE-4.5-21B-A3B 基础上训练的深度思考模型,支持 128K 的上下文窗口,适用于需要长上下文的复杂推理任务。该模型不仅在逻辑推理、数学、科学,代码与文本生成等需要人类专家的任务上实现了显著提升,还具备高效的工具调用能力,能够支持复杂任务的自动化处理。

ERNIE-4.5-21B-A3B-Thinking 作为一款 21B 总参数量,激活仅 3B 的轻量级模型,在各项测试中的表现紧追业界顶级大尺寸模型,以轻量级规模实现了接近 SOTA 的智能表现。

 

Search

没有结果
查看所有结果

一周热门

生猪价格跌至年内新低 行业面临不同程度亏损

100% 关税!美国突发威胁!事关芯片 韩国紧急回应!

2026 年 1 月 17 日
「星链」成地缘冲突工具,起底马斯克SpaceX的「吸金」逻辑;美联储主席人选生变;欧洲向格陵兰岛派兵,特朗普发声;金银比14年首次跌破50 | 一周国际财经

「星链」 成地缘冲突工具,起底马斯克 SpaceX 的 「吸金」 逻辑;美联储主席人选生变;欧洲向格陵兰岛派兵,特朗普发声;金银比 14 年首次跌破 50 | 一周国际财经

2026 年 1 月 17 日

关注证券 ETF(512880) 投资机会,券商板块迎来基本面与估值双重修复窗口期

2026 年 1 月 17 日
生猪价格跌至年内新低 行业面临不同程度亏损

半导体材料重大突破!碳化硅龙头已抢先发力

2026 年 1 月 17 日
「星链」成地缘冲突工具,订阅规模4年半激增114倍!起底马斯克SpaceX「吸金」逻辑

「星链」 成地缘冲突工具,订阅规模 4 年半激增 114 倍!起底马斯克 SpaceX「吸金」 逻辑

2026 年 1 月 17 日

1 月 17 日晚间央视新闻联播要闻集锦

2026 年 1 月 17 日

违规分红迎强监管!基金以 「高比例分红」 为 「卖点」 协助投资者逃避税等行为,将被采取监管措施

2026 年 1 月 17 日

商务部美大司负责人解读中国加拿大经贸磋商成果

2026 年 1 月 17 日

国务院:支持消费新业态新模式新场景竞相涌现,制定实施城乡居民增收计划

2026 年 1 月 17 日
央广财评丨坚持稳字当头 A股要的不是「疯牛」而是「长牛」

央广财评丨坚持稳字当头 A 股要的不是 「疯牛」 而是 「长牛」

2026 年 1 月 17 日
金桂财经

2026 年 1 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 12 月    

近期动态

  • 100% 关税!美国突发威胁!事关芯片 韩国紧急回应!
  • 「星链」 成地缘冲突工具,起底马斯克 SpaceX 的 「吸金」 逻辑;美联储主席人选生变;欧洲向格陵兰岛派兵,特朗普发声;金银比 14 年首次跌破 50 | 一周国际财经
  • 关注证券 ETF(512880) 投资机会,券商板块迎来基本面与估值双重修复窗口期
  • 半导体材料重大突破!碳化硅龙头已抢先发力
  • 「星链」 成地缘冲突工具,订阅规模 4 年半激增 114 倍!起底马斯克 SpaceX「吸金」 逻辑
  • 1 月 17 日晚间央视新闻联播要闻集锦
广告

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 关于本站
  • 联系我们
  • 隐私政策
没有结果
查看所有结果
  • 登录& 注册

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 登录
  • 注册
忘记密码?
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.
body::-webkit-scrollbar { width: 7px; } body::-webkit-scrollbar-track { border-radius: 10px; background: #f0f0f0; } body::-webkit-scrollbar-thumb { border-radius: 50px; background: #dfdbdb }