• 最新
  • 热门
  • 所有
  • 外汇
  • 24 小时
  • 期货
  • 基金
  • 贵金属
  • 股票

华为发布!国产算力与国产模型重大突破

2025 年 5 月 31 日
美联储明晨大概率重启降息 年内将降息几次?

公募新规新动态!两类 「基准库」 出炉 「投资之锚」 每半年动态调整

2025 年 11 月 5 日
美联储明晨大概率重启降息 年内将降息几次?

国际金融机构热议中国投资机遇:中国股市规模庞大 「不容忽视」

2025 年 11 月 5 日
供大于求格局延续 尿素价格短期继续弱稳承压运行

供大于求格局延续 尿素价格短期继续弱稳承压运行

2025 年 11 月 5 日
广告

十倍股*ST 亚振大起底:「先知先觉」 资金提前一年大量扫货,控制权变更、收购矿产刺激股价暴涨!

2025 年 11 月 5 日
税收新政鼓励场内交易 黄金ETF又要「火」了?

税收新政鼓励场内交易 黄金 ETF 又要 「火」 了?

2025 年 11 月 5 日

生物科技股复苏:四大因素推动行业上涨

2025 年 11 月 5 日

市场震荡调整,关注 A500ETF 易方达 (159361) 等产品投资机会

2025 年 11 月 5 日

黄金 2025 年顶部已现?盛宝银行唱多:明年料迎新一轮大涨!

2025 年 11 月 5 日

科创板收盘播报:科创 50 指数缩量涨 0.23% 电气设备股涨幅居前

2025 年 11 月 5 日

开源证券:2026 年前后更可能是 「平顶慢牛」 而非 「尖顶短牛」

2025 年 11 月 5 日
碰撞后车门无法开启 五人不幸遇难 特斯拉在美被起诉

碰撞后车门无法开启 五人不幸遇难 特斯拉在美被起诉

2025 年 11 月 5 日

京东 1 号车下线,亮点有这些!

2025 年 11 月 5 日
金桂财经
广告
2025 年 11 月 5 日 星期三
联系我们
合作建议
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
  • 登录& 注册
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
没有结果
查看所有结果
金桂财经
没有结果
查看所有结果

华为发布!国产算力与国产模型重大突破

来自 金桂财经
2025 年 5 月 31 日
在 24 小时
0

作者:
胡飞军

  中国 AI 产业注入强心剂。

  5 月 30 日,券商中国记者从华为获悉,华为在 MoE 模型训练领域再进一步,重磅推出参数规模高达 7180 亿的全新模型——盘古 Ultra MoE,这是一个全流程在昇腾 AI 计算平台上训练的准万亿 MoE 模型。同时,华为发布盘古 Ultra MoE 模型架构和训练方法的技术报告,披露众多技术细节,充分体现了昇腾在超大规模 MoE 训练性能上的跨越。

  业内人士分析,华为盘古 Ultra MoE 和盘古 Pro MoE 系列模型的发布,证明华为不仅完成了国产算力+国产模型的全流程自主可控的训练实践,同时在集群训练系统的性能上也实现了业界领先。这意味着国产 AI 基础设施的自主创新能力得到了进一步验证,为中国人工智能产业的发展提供了一颗 「定心丸」。

  国产算力与国产模型重大突破

  据悉,训练超大规模和极高稀疏性的 MoE 模型极具挑战,训练过程中的稳定性往往难以保障。针对这一难题,华为盘古团队在模型架构和训练方法上进行了创新性设计,成功地在昇腾平台上实现了准万亿 MoE 模型的全流程训练。

  在模型架构上,盘古团队提出 Depth-Scaled Sandwich-Norm(DSSN) 稳定架构和 TinyInit 小初始化的方法,在昇腾平台上实现了超过 18TB 数据的长期稳定训练。此外,他们还提出了 EP loss 负载优化方法,这一设计不仅保证了各个专家之间的能保持较好的负载均衡,也提升了专家的领域特化能力。同时,盘古 Ultra MoE 使用了业界先进的 MLA 和 MTP 架构,在预训练和后训练阶段都使用了 Dropless 训练策略,实现了超大规模 MoE 架构在模型效果与效率之间的最佳平衡。

  在训练方法上,华为团队首次披露在昇腾 CloudMatrix 384 超节点上,高效打通大稀疏比 MoE 强化学习 (RL) 后训练框架的关键技术,使 RL 后训练进入超节点集群时代。同时,在 5 月初发布的预训练系统加速技术基础上,在不到一个月的时间内,华为团队又完成了一轮迭代升级,包括:适配昇腾硬件的自适应流水掩盖策略,进一步优化算子执行程序,进一步降低 Host-Bound 以及提升 EP 通信的掩盖;自适应管理内存优化策略的开发;数据重排实现 DP 间 Attention 负载均衡;以及昇腾亲和的算子优化,这些技术实现万卡集群预训练 MFU 由 30% 大幅提升至 41%。

  此外,近期发布的盘古 Pro MoE 大模型,在参数量仅为 720 亿、激活 160 亿参数量的情况下,通过动态激活专家网络的创新设计,实现了以小博大的优异性能,甚至可以媲美千亿级模型的性能表现。在业界权威大模型榜单 SuperCLUE 最新公布的 2025 年 5 月排行榜上,位居千亿参数量以内大模型排行并列国内第一。

  业内人士分析,华为此举的核心意义在于,证明了在国产 AI 算力平台 (昇腾) 上,能够高效、稳定地训练并优化达到国际顶尖水平的超大规模稀疏模型 (MoE),实现了从硬件到软件、从训练到优化、从基础研究到工程落地的 「全栈国产化」 和 「全流程自主可控」 的闭环,并在关键性能指标上达到业界领先水平。

  国内大模型消息不断

  5 月 28 日,深度求索公司传来消息,DeepSeek-R1 模型已完成小版本试升级,可前往官方网页、APP、小程序测试 (打开深度思考),API 接口和使用方式保持不变。

  这家总部位于杭州的初创公司今年 1 月发布了 DeepSeek-R1 人工智能模型,震惊了全球科技界。R1 模型在多项标准化指标上的表现均优于西方竞争对手,而其成本据称仅为数百万美元。此举引发了全球科技股的暴跌,投资者开始质疑,领先的公司是否仍需要投入巨资来构建人工智能服务。

  这是自 3 月底以来,DeepSeek 的一次最新动作。3 月 25 日晚,DeepSeek 公司在官方账号上正式宣布 V3 模型完成小版本升级的消息,并介绍了新版本 DeepSeek-V3-0324 模型的提升细节,包括推理、前端开发、中文写作、中文搜索几个方面的能力优化。彼时,据海外专业 AI 模型评测机构最新排名,新版 V3 模型是得分最高的非推理模型,超过 xAI 的 Grok3 和 OpenAI 的 GPT-4.5(preview)。

  5 月 21 日,在 2025 腾讯云AI 产业应用峰会上,腾讯大模型战略首次全景亮相,从自研的混元大模型、到 AI 云基础设施,再到智能体开发工具、知识库以及面向场景的应用,腾讯大模型矩阵产品全面升级。腾讯正通过持续打磨技术和产品能力,为企业和用户在大模型时代打造真正 「好用的 AI」。

  在疯狂卷技术的全球大模型角逐中,腾讯混元正小步快跑、快速迭代,技术能力持续提升。

  腾讯集团高级执行副总裁、云与智慧产业事业群 CEO 汤道生在会上宣布,在全球公认的权威大语言模型评测平台 Chatbot Arena 上,混元 TurboS 排名已攀升至全球前八,国内仅次于 DeepSeek。其中,代码、数学等理科能力,混元 TurboS 也进入全球前十。

  5 月 29 日,腾讯旗下腾讯元宝、ima、搜狗输入法、QQ 浏览器、腾讯文档、腾讯地图、腾讯乐享等多款 AI 应用宣布接入 DeepSeek R1-0528,用户在不同产品中,选择 DeepSeek 模型 R1 深度思考,都可以体验到 DeepSeek R1-0528 最新的深度思考、编程和长文本处理等能力。

(证券时报网)

文章转载自东方财富

YOU MAY ALSO LIKE

公募新规新动态!两类 「基准库」 出炉 「投资之锚」 每半年动态调整

税收新政鼓励场内交易 黄金 ETF 又要 「火」 了?

Search

没有结果
查看所有结果

一周热门

美联储明晨大概率重启降息 年内将降息几次?

公募新规新动态!两类 「基准库」 出炉 「投资之锚」 每半年动态调整

2025 年 11 月 5 日
美联储明晨大概率重启降息 年内将降息几次?

国际金融机构热议中国投资机遇:中国股市规模庞大 「不容忽视」

2025 年 11 月 5 日
供大于求格局延续 尿素价格短期继续弱稳承压运行

供大于求格局延续 尿素价格短期继续弱稳承压运行

2025 年 11 月 5 日

十倍股*ST 亚振大起底:「先知先觉」 资金提前一年大量扫货,控制权变更、收购矿产刺激股价暴涨!

2025 年 11 月 5 日
税收新政鼓励场内交易 黄金ETF又要「火」了?

税收新政鼓励场内交易 黄金 ETF 又要 「火」 了?

2025 年 11 月 5 日

生物科技股复苏:四大因素推动行业上涨

2025 年 11 月 5 日

市场震荡调整,关注 A500ETF 易方达 (159361) 等产品投资机会

2025 年 11 月 5 日

黄金 2025 年顶部已现?盛宝银行唱多:明年料迎新一轮大涨!

2025 年 11 月 5 日

科创板收盘播报:科创 50 指数缩量涨 0.23% 电气设备股涨幅居前

2025 年 11 月 5 日

开源证券:2026 年前后更可能是 「平顶慢牛」 而非 「尖顶短牛」

2025 年 11 月 5 日
金桂财经

2025 年 11 月
一 二 三 四 五 六 日
 12
3456789
10111213141516
17181920212223
24252627282930
« 10 月    

近期动态

  • 公募新规新动态!两类 「基准库」 出炉 「投资之锚」 每半年动态调整
  • 国际金融机构热议中国投资机遇:中国股市规模庞大 「不容忽视」
  • 供大于求格局延续 尿素价格短期继续弱稳承压运行
  • 十倍股*ST 亚振大起底:「先知先觉」 资金提前一年大量扫货,控制权变更、收购矿产刺激股价暴涨!
  • 税收新政鼓励场内交易 黄金 ETF 又要 「火」 了?
  • 生物科技股复苏:四大因素推动行业上涨
广告

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 关于本站
  • 联系我们
  • 隐私政策
没有结果
查看所有结果
  • 登录& 注册

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 登录
  • 注册
忘记密码?
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.
body::-webkit-scrollbar { width: 7px; } body::-webkit-scrollbar-track { border-radius: 10px; background: #f0f0f0; } body::-webkit-scrollbar-thumb { border-radius: 50px; background: #dfdbdb }