• 最新
  • 热门
  • 所有
  • 外汇
  • 24 小时
  • 期货
  • 基金
  • 贵金属
  • 股票
开源即登顶!百度文心思考模型ERNIE-4.5-21B-A3B-Thinking登顶HuggingFace全球模型趋势榜

开源即登顶!百度文心思考模型 ERNIE-4.5-21B-A3B-Thinking 登顶 HuggingFace 全球模型趋势榜

2025 年 9 月 11 日

波音初步达成劳资协议,罢工有望结束

2025 年 9 月 12 日
摩根士丹利:预计黄金年底突破每盎司3800美元

摩根士丹利:预计黄金年底突破每盎司 3800 美元

2025 年 9 月 12 日
马斯克震撼预言:到2030年 AI将比所有人类加起来都聪明!

马斯克震撼预言:到 2030 年 AI 将比所有人类加起来都聪明!

2025 年 9 月 12 日
广告
最新!苹果iPhone Air国行版当前仅支持中国联通eSIM服务!什么是eSIM,如何设置,一文看懂

最新!苹果 iPhone Air 国行版当前仅支持中国联通 eSIM 服务!什么是 eSIM,如何设置,一文看懂

2025 年 9 月 12 日

我国开展要素市场化配置综合改革试点

2025 年 9 月 12 日
商务部新闻发言人就墨西哥拟对有关贸易伙伴提高进口关税税率事答记者问

商务部新闻发言人就墨西哥拟对有关贸易伙伴提高进口关税税率事答记者问

2025 年 9 月 12 日
CPO有多火?一众机构追到行业展会调研 贝莱德、淡马锡等在列

CPO 有多火?一众机构追到行业展会调研 贝莱德、淡马锡等在列

2025 年 9 月 11 日
库存止增转降拐点虽迟但到 9月中下旬豆油价格仍有走强预期

库存止增转降拐点虽迟但到 9 月中下旬豆油价格仍有走强预期

2025 年 9 月 11 日
美国经济现严重分化:三分之一的州拉响衰退警报

美国经济现严重分化:三分之一的州拉响衰退警报

2025 年 9 月 11 日

黄金开启新一轮上涨;传媒行业景气度有望持续向上 | 券商晨会

2025 年 9 月 11 日

Meta 高薪挖角 AI 精英,引发内部薪酬焦虑与文化摩擦

2025 年 9 月 11 日

医药板块震荡调整,恒生创新药 ETF(159316) 逆势吸筹,全天获超 1 亿份净申购

2025 年 9 月 11 日
金桂财经
广告
2025 年 9 月 12 日 星期五
联系我们
合作建议
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
  • 登录& 注册
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
没有结果
查看所有结果
金桂财经
没有结果
查看所有结果

开源即登顶!百度文心思考模型 ERNIE-4.5-21B-A3B-Thinking 登顶 HuggingFace 全球模型趋势榜

来自 金桂财经
2025 年 9 月 11 日
在 科技
0

【文章来源:techweb】

【TechWeb】9 月 11 日消息,在 9 日举办的 WAVE SUMMIT 深度学习开发者大会 2025 现场,百度开源最新的思考模型 ERNIE-4.5-21B-A3B-Thinking。

据 HuggingFace 官网数据,截至 2025 年 9 月 11 日,百度最新开源的文心思考模型 ERNIE-4.5-21B-A3B-Thinking,在 HuggingFace 文本模型趋势榜上排名第一,模型总榜排名第三。

ERNIE-4.5-21B-A3B-Thinking 采用了混合专家 (MoE) 架构,总参数规模达 21B,每个 token 激活 3B 参数,通过指令微调及强化学习训练。ERNIE-4.5-21B-A3B-Thinking 是在 ERNIE-4.5-21B-A3B 基础上训练的深度思考模型,支持 128K 的上下文窗口,适用于需要长上下文的复杂推理任务。该模型不仅在逻辑推理、数学、科学,代码与文本生成等需要人类专家的任务上实现了显著提升,还具备高效的工具调用能力,能够支持复杂任务的自动化处理。

ERNIE-4.5-21B-A3B-Thinking 作为一款 21B 总参数量,激活仅 3B 的轻量级模型,在各项测试中的表现紧追业界顶级大尺寸模型,以轻量级规模实现了接近 SOTA 的智能表现。

 

【文章来源:techweb】

【TechWeb】9 月 11 日消息,在 9 日举办的 WAVE SUMMIT 深度学习开发者大会 2025 现场,百度开源最新的思考模型 ERNIE-4.5-21B-A3B-Thinking。

据 HuggingFace 官网数据,截至 2025 年 9 月 11 日,百度最新开源的文心思考模型 ERNIE-4.5-21B-A3B-Thinking,在 HuggingFace 文本模型趋势榜上排名第一,模型总榜排名第三。

ERNIE-4.5-21B-A3B-Thinking 采用了混合专家 (MoE) 架构,总参数规模达 21B,每个 token 激活 3B 参数,通过指令微调及强化学习训练。ERNIE-4.5-21B-A3B-Thinking 是在 ERNIE-4.5-21B-A3B 基础上训练的深度思考模型,支持 128K 的上下文窗口,适用于需要长上下文的复杂推理任务。该模型不仅在逻辑推理、数学、科学,代码与文本生成等需要人类专家的任务上实现了显著提升,还具备高效的工具调用能力,能够支持复杂任务的自动化处理。

ERNIE-4.5-21B-A3B-Thinking 作为一款 21B 总参数量,激活仅 3B 的轻量级模型,在各项测试中的表现紧追业界顶级大尺寸模型,以轻量级规模实现了接近 SOTA 的智能表现。

 

YOU MAY ALSO LIKE

小红书回应被查处:成立整改专项工作小组

TechWeb 微晚报:OpenAI 同甲骨文签订 3000 亿美元合同,理想远程召唤功能被举报下线

【文章来源:techweb】

【TechWeb】9 月 11 日消息,在 9 日举办的 WAVE SUMMIT 深度学习开发者大会 2025 现场,百度开源最新的思考模型 ERNIE-4.5-21B-A3B-Thinking。

据 HuggingFace 官网数据,截至 2025 年 9 月 11 日,百度最新开源的文心思考模型 ERNIE-4.5-21B-A3B-Thinking,在 HuggingFace 文本模型趋势榜上排名第一,模型总榜排名第三。

ERNIE-4.5-21B-A3B-Thinking 采用了混合专家 (MoE) 架构,总参数规模达 21B,每个 token 激活 3B 参数,通过指令微调及强化学习训练。ERNIE-4.5-21B-A3B-Thinking 是在 ERNIE-4.5-21B-A3B 基础上训练的深度思考模型,支持 128K 的上下文窗口,适用于需要长上下文的复杂推理任务。该模型不仅在逻辑推理、数学、科学,代码与文本生成等需要人类专家的任务上实现了显著提升,还具备高效的工具调用能力,能够支持复杂任务的自动化处理。

ERNIE-4.5-21B-A3B-Thinking 作为一款 21B 总参数量,激活仅 3B 的轻量级模型,在各项测试中的表现紧追业界顶级大尺寸模型,以轻量级规模实现了接近 SOTA 的智能表现。

 

【文章来源:techweb】

【TechWeb】9 月 11 日消息,在 9 日举办的 WAVE SUMMIT 深度学习开发者大会 2025 现场,百度开源最新的思考模型 ERNIE-4.5-21B-A3B-Thinking。

据 HuggingFace 官网数据,截至 2025 年 9 月 11 日,百度最新开源的文心思考模型 ERNIE-4.5-21B-A3B-Thinking,在 HuggingFace 文本模型趋势榜上排名第一,模型总榜排名第三。

ERNIE-4.5-21B-A3B-Thinking 采用了混合专家 (MoE) 架构,总参数规模达 21B,每个 token 激活 3B 参数,通过指令微调及强化学习训练。ERNIE-4.5-21B-A3B-Thinking 是在 ERNIE-4.5-21B-A3B 基础上训练的深度思考模型,支持 128K 的上下文窗口,适用于需要长上下文的复杂推理任务。该模型不仅在逻辑推理、数学、科学,代码与文本生成等需要人类专家的任务上实现了显著提升,还具备高效的工具调用能力,能够支持复杂任务的自动化处理。

ERNIE-4.5-21B-A3B-Thinking 作为一款 21B 总参数量,激活仅 3B 的轻量级模型,在各项测试中的表现紧追业界顶级大尺寸模型,以轻量级规模实现了接近 SOTA 的智能表现。

 

Search

没有结果
查看所有结果

一周热门

波音初步达成劳资协议,罢工有望结束

2025 年 9 月 12 日
摩根士丹利:预计黄金年底突破每盎司3800美元

摩根士丹利:预计黄金年底突破每盎司 3800 美元

2025 年 9 月 12 日
马斯克震撼预言:到2030年 AI将比所有人类加起来都聪明!

马斯克震撼预言:到 2030 年 AI 将比所有人类加起来都聪明!

2025 年 9 月 12 日
最新!苹果iPhone Air国行版当前仅支持中国联通eSIM服务!什么是eSIM,如何设置,一文看懂

最新!苹果 iPhone Air 国行版当前仅支持中国联通 eSIM 服务!什么是 eSIM,如何设置,一文看懂

2025 年 9 月 12 日

我国开展要素市场化配置综合改革试点

2025 年 9 月 12 日
商务部新闻发言人就墨西哥拟对有关贸易伙伴提高进口关税税率事答记者问

商务部新闻发言人就墨西哥拟对有关贸易伙伴提高进口关税税率事答记者问

2025 年 9 月 12 日
CPO有多火?一众机构追到行业展会调研 贝莱德、淡马锡等在列

CPO 有多火?一众机构追到行业展会调研 贝莱德、淡马锡等在列

2025 年 9 月 11 日
库存止增转降拐点虽迟但到 9月中下旬豆油价格仍有走强预期

库存止增转降拐点虽迟但到 9 月中下旬豆油价格仍有走强预期

2025 年 9 月 11 日
美国经济现严重分化:三分之一的州拉响衰退警报

美国经济现严重分化:三分之一的州拉响衰退警报

2025 年 9 月 11 日

黄金开启新一轮上涨;传媒行业景气度有望持续向上 | 券商晨会

2025 年 9 月 11 日
金桂财经

2025 年 9 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
2930  
« 8 月    

近期动态

  • 波音初步达成劳资协议,罢工有望结束
  • 摩根士丹利:预计黄金年底突破每盎司 3800 美元
  • 马斯克震撼预言:到 2030 年 AI 将比所有人类加起来都聪明!
  • 最新!苹果 iPhone Air 国行版当前仅支持中国联通 eSIM 服务!什么是 eSIM,如何设置,一文看懂
  • 我国开展要素市场化配置综合改革试点
  • 商务部新闻发言人就墨西哥拟对有关贸易伙伴提高进口关税税率事答记者问
广告

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 关于本站
  • 联系我们
  • 隐私政策
没有结果
查看所有结果
  • 登录& 注册

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 登录
  • 注册
忘记密码?
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.
body::-webkit-scrollbar { width: 7px; } body::-webkit-scrollbar-track { border-radius: 10px; background: #f0f0f0; } body::-webkit-scrollbar-thumb { border-radius: 50px; background: #dfdbdb }