• 最新
  • 热门
  • 所有
  • 外汇
  • 24 小时
  • 期货
  • 基金
  • 贵金属
  • 股票
开源即登顶!百度文心思考模型ERNIE-4.5-21B-A3B-Thinking登顶HuggingFace全球模型趋势榜

开源即登顶!百度文心思考模型 ERNIE-4.5-21B-A3B-Thinking 登顶 HuggingFace 全球模型趋势榜

2025 年 9 月 11 日
比尔·盖茨跌出前十!2025年福布斯美国富豪榜公布

比尔·盖茨跌出前十!2025 年福布斯美国富豪榜公布

2025 年 9 月 11 日
商务部召开外贸企业圆桌会:推动解决外贸企业困难和问题

商务部召开外贸企业圆桌会:推动解决外贸企业困难和问题

2025 年 9 月 11 日
新华财经晚报:前8个月汽车产销量首次双超2000万辆

新华财经晚报:前 8 个月汽车产销量首次双超 2000 万辆

2025 年 9 月 11 日
广告
土耳其央行将基准利率下调至40.5% 下降250个基点

土耳其央行将基准利率下调至 40.5% 下降 250 个基点

2025 年 9 月 11 日
降息预期升温,黄金为何仍被风险偏好压制?

降息预期升温,黄金为何仍被风险偏好压制?

2025 年 9 月 11 日

券商再融资再添重磅信号!今年已有 5 家券商定增事项加速推进;东兴证券公开招聘首席经济学家 | 券商基金早参

2025 年 9 月 11 日

储能系统招标容量快速增长,相关产品受关注,储能电池 ETF(159566) 近一周 「吸金」 约 7 亿元

2025 年 9 月 11 日
美联储缩表至6.6万亿美元,但刺激政策远未完全退出

美联储缩表至 6.6 万亿美元,但刺激政策远未完全退出

2025 年 9 月 11 日
奇瑞墨甲10月公开发布并开启招商 车企造人形机器人加速「上岗」

奇瑞墨甲 10 月公开发布并开启招商 车企造人形机器人加速 「上岗」

2025 年 9 月 11 日
焦煤、焦炭主力合约日间盘涨幅居前 警惕情绪反复对盘面造成扰动

焦煤、焦炭主力合约日间盘涨幅居前 警惕情绪反复对盘面造成扰动

2025 年 9 月 11 日

诺和诺德裁员 9,000 人,加快转型应对减重药市场激烈竞争

2025 年 9 月 11 日
中东局势再升级!15架战机发射10枚导弹只打一处,特朗普:对以色列袭击卡塔尔「并不感到高兴」,美国白宫回应......

中东局势再升级!15 架战机发射 10 枚导弹只打一处,特朗普:对以色列袭击卡塔尔 「并不感到高兴」,美国白宫回应......

2025 年 9 月 11 日
金桂财经
广告
2025 年 9 月 11 日 星期四
联系我们
合作建议
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
  • 登录& 注册
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
没有结果
查看所有结果
金桂财经
没有结果
查看所有结果

开源即登顶!百度文心思考模型 ERNIE-4.5-21B-A3B-Thinking 登顶 HuggingFace 全球模型趋势榜

来自 金桂财经
2025 年 9 月 11 日
在 科技
0

【文章来源:techweb】

【TechWeb】9 月 11 日消息,在 9 日举办的 WAVE SUMMIT 深度学习开发者大会 2025 现场,百度开源最新的思考模型 ERNIE-4.5-21B-A3B-Thinking。

据 HuggingFace 官网数据,截至 2025 年 9 月 11 日,百度最新开源的文心思考模型 ERNIE-4.5-21B-A3B-Thinking,在 HuggingFace 文本模型趋势榜上排名第一,模型总榜排名第三。

ERNIE-4.5-21B-A3B-Thinking 采用了混合专家 (MoE) 架构,总参数规模达 21B,每个 token 激活 3B 参数,通过指令微调及强化学习训练。ERNIE-4.5-21B-A3B-Thinking 是在 ERNIE-4.5-21B-A3B 基础上训练的深度思考模型,支持 128K 的上下文窗口,适用于需要长上下文的复杂推理任务。该模型不仅在逻辑推理、数学、科学,代码与文本生成等需要人类专家的任务上实现了显著提升,还具备高效的工具调用能力,能够支持复杂任务的自动化处理。

ERNIE-4.5-21B-A3B-Thinking 作为一款 21B 总参数量,激活仅 3B 的轻量级模型,在各项测试中的表现紧追业界顶级大尺寸模型,以轻量级规模实现了接近 SOTA 的智能表现。

 

【文章来源:techweb】

【TechWeb】9 月 11 日消息,在 9 日举办的 WAVE SUMMIT 深度学习开发者大会 2025 现场,百度开源最新的思考模型 ERNIE-4.5-21B-A3B-Thinking。

据 HuggingFace 官网数据,截至 2025 年 9 月 11 日,百度最新开源的文心思考模型 ERNIE-4.5-21B-A3B-Thinking,在 HuggingFace 文本模型趋势榜上排名第一,模型总榜排名第三。

ERNIE-4.5-21B-A3B-Thinking 采用了混合专家 (MoE) 架构,总参数规模达 21B,每个 token 激活 3B 参数,通过指令微调及强化学习训练。ERNIE-4.5-21B-A3B-Thinking 是在 ERNIE-4.5-21B-A3B 基础上训练的深度思考模型,支持 128K 的上下文窗口,适用于需要长上下文的复杂推理任务。该模型不仅在逻辑推理、数学、科学,代码与文本生成等需要人类专家的任务上实现了显著提升,还具备高效的工具调用能力,能够支持复杂任务的自动化处理。

ERNIE-4.5-21B-A3B-Thinking 作为一款 21B 总参数量,激活仅 3B 的轻量级模型,在各项测试中的表现紧追业界顶级大尺寸模型,以轻量级规模实现了接近 SOTA 的智能表现。

 

YOU MAY ALSO LIKE

小红书回应被查处:成立整改专项工作小组

TechWeb 微晚报:OpenAI 同甲骨文签订 3000 亿美元合同,理想远程召唤功能被举报下线

【文章来源:techweb】

【TechWeb】9 月 11 日消息,在 9 日举办的 WAVE SUMMIT 深度学习开发者大会 2025 现场,百度开源最新的思考模型 ERNIE-4.5-21B-A3B-Thinking。

据 HuggingFace 官网数据,截至 2025 年 9 月 11 日,百度最新开源的文心思考模型 ERNIE-4.5-21B-A3B-Thinking,在 HuggingFace 文本模型趋势榜上排名第一,模型总榜排名第三。

ERNIE-4.5-21B-A3B-Thinking 采用了混合专家 (MoE) 架构,总参数规模达 21B,每个 token 激活 3B 参数,通过指令微调及强化学习训练。ERNIE-4.5-21B-A3B-Thinking 是在 ERNIE-4.5-21B-A3B 基础上训练的深度思考模型,支持 128K 的上下文窗口,适用于需要长上下文的复杂推理任务。该模型不仅在逻辑推理、数学、科学,代码与文本生成等需要人类专家的任务上实现了显著提升,还具备高效的工具调用能力,能够支持复杂任务的自动化处理。

ERNIE-4.5-21B-A3B-Thinking 作为一款 21B 总参数量,激活仅 3B 的轻量级模型,在各项测试中的表现紧追业界顶级大尺寸模型,以轻量级规模实现了接近 SOTA 的智能表现。

 

【文章来源:techweb】

【TechWeb】9 月 11 日消息,在 9 日举办的 WAVE SUMMIT 深度学习开发者大会 2025 现场,百度开源最新的思考模型 ERNIE-4.5-21B-A3B-Thinking。

据 HuggingFace 官网数据,截至 2025 年 9 月 11 日,百度最新开源的文心思考模型 ERNIE-4.5-21B-A3B-Thinking,在 HuggingFace 文本模型趋势榜上排名第一,模型总榜排名第三。

ERNIE-4.5-21B-A3B-Thinking 采用了混合专家 (MoE) 架构,总参数规模达 21B,每个 token 激活 3B 参数,通过指令微调及强化学习训练。ERNIE-4.5-21B-A3B-Thinking 是在 ERNIE-4.5-21B-A3B 基础上训练的深度思考模型,支持 128K 的上下文窗口,适用于需要长上下文的复杂推理任务。该模型不仅在逻辑推理、数学、科学,代码与文本生成等需要人类专家的任务上实现了显著提升,还具备高效的工具调用能力,能够支持复杂任务的自动化处理。

ERNIE-4.5-21B-A3B-Thinking 作为一款 21B 总参数量,激活仅 3B 的轻量级模型,在各项测试中的表现紧追业界顶级大尺寸模型,以轻量级规模实现了接近 SOTA 的智能表现。

 

Search

没有结果
查看所有结果

一周热门

比尔·盖茨跌出前十!2025年福布斯美国富豪榜公布

比尔·盖茨跌出前十!2025 年福布斯美国富豪榜公布

2025 年 9 月 11 日
商务部召开外贸企业圆桌会:推动解决外贸企业困难和问题

商务部召开外贸企业圆桌会:推动解决外贸企业困难和问题

2025 年 9 月 11 日
新华财经晚报:前8个月汽车产销量首次双超2000万辆

新华财经晚报:前 8 个月汽车产销量首次双超 2000 万辆

2025 年 9 月 11 日
土耳其央行将基准利率下调至40.5% 下降250个基点

土耳其央行将基准利率下调至 40.5% 下降 250 个基点

2025 年 9 月 11 日
降息预期升温,黄金为何仍被风险偏好压制?

降息预期升温,黄金为何仍被风险偏好压制?

2025 年 9 月 11 日

券商再融资再添重磅信号!今年已有 5 家券商定增事项加速推进;东兴证券公开招聘首席经济学家 | 券商基金早参

2025 年 9 月 11 日

储能系统招标容量快速增长,相关产品受关注,储能电池 ETF(159566) 近一周 「吸金」 约 7 亿元

2025 年 9 月 11 日
美联储缩表至6.6万亿美元,但刺激政策远未完全退出

美联储缩表至 6.6 万亿美元,但刺激政策远未完全退出

2025 年 9 月 11 日
奇瑞墨甲10月公开发布并开启招商 车企造人形机器人加速「上岗」

奇瑞墨甲 10 月公开发布并开启招商 车企造人形机器人加速 「上岗」

2025 年 9 月 11 日
焦煤、焦炭主力合约日间盘涨幅居前 警惕情绪反复对盘面造成扰动

焦煤、焦炭主力合约日间盘涨幅居前 警惕情绪反复对盘面造成扰动

2025 年 9 月 11 日
金桂财经

2025 年 9 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
2930  
« 8 月    

近期动态

  • 比尔·盖茨跌出前十!2025 年福布斯美国富豪榜公布
  • 商务部召开外贸企业圆桌会:推动解决外贸企业困难和问题
  • 新华财经晚报:前 8 个月汽车产销量首次双超 2000 万辆
  • 土耳其央行将基准利率下调至 40.5% 下降 250 个基点
  • 降息预期升温,黄金为何仍被风险偏好压制?
  • 券商再融资再添重磅信号!今年已有 5 家券商定增事项加速推进;东兴证券公开招聘首席经济学家 | 券商基金早参
广告

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 关于本站
  • 联系我们
  • 隐私政策
没有结果
查看所有结果
  • 登录& 注册

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 登录
  • 注册
忘记密码?
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.
body::-webkit-scrollbar { width: 7px; } body::-webkit-scrollbar-track { border-radius: 10px; background: #f0f0f0; } body::-webkit-scrollbar-thumb { border-radius: 50px; background: #dfdbdb }