• 最新
  • 热门
  • 所有
  • 外汇
  • 24 小时
  • 期货
  • 基金
  • 贵金属
  • 股票
美国与欧盟达成贸易协议

AI 算力集群迈进 「万卡」 时代 超节点为什么火了?

2025 年 7 月 31 日

美国政府 「重开」 曙光初现?两党议员对结束停摆表示乐观

2025 年 11 月 6 日
安吉尔38年重构全屋净饮水市场  以长期主义引领技术、产品、渠道全面升维

安吉尔 38 年重构全屋净饮水市场 以长期主义引领技术、产品、渠道全面升维

2025 年 11 月 6 日

上市公司含 「科」 量进一步提高,关注 A500ETF 易方达 (159361)、科创板 50ETF(588080) 投资机会

2025 年 11 月 6 日
广告

芝商所亚太区董事总经理拉塞尔·贝蒂:中国期货市场应加强与国际的互联互通

2025 年 11 月 6 日
何小鹏:明年目标规模量产高阶人形机器人!Robotaxi也要来了!

何小鹏:明年目标规模量产高阶人形机器人!Robotaxi 也要来了!

2025 年 11 月 6 日
苹果被爆大动作,售价或远低于1000美元!

苹果被爆大动作,售价或远低于 1000 美元!

2025 年 11 月 6 日

面对通胀担忧声浪 美联储米兰仍呼吁 「继续降息之路」

2025 年 11 月 6 日

新湖期货总经理金玉卫:以体系化创新践行 《意见》 精神

2025 年 11 月 6 日

「小非农」 超预期反弹,美国就业市场回暖?

2025 年 11 月 6 日
商品日报(11月5日):集运欧线强势续涨超4% 多晶硅两日累跌超5%

商品日报 (11 月 5 日):集运欧线强势续涨超 4% 多晶硅两日累跌超 5%

2025 年 11 月 6 日
美联储明晨大概率重启降息 年内将降息几次?

华尔街大行抱团买入 外资 A 股最新持仓曝光

2025 年 11 月 6 日
全球第四大加密货币发行商估值达到400亿美元

全球第四大加密货币发行商估值达到 400 亿美元

2025 年 11 月 6 日
金桂财经
广告
2025 年 11 月 6 日 星期四
联系我们
合作建议
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
  • 登录& 注册
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
没有结果
查看所有结果
金桂财经
没有结果
查看所有结果

AI 算力集群迈进 「万卡」 时代 超节点为什么火了?

来自 金桂财经
2025 年 7 月 31 日
在 24 小时
0

作者:
郑栩彤

  刚落幕的 2025 世界人工智能大会暨人工智能全球治理高级别会议 (WAIC) 上,华为展台展出一整面昇腾 384 超节点的 「墙」。记者看到,不断有观众与之合影。

  超节点 (SuperPod) 成为本届 WAIC 的热点。除了华为,WAIC 期间,上海仪电还联合曦智科技、壁仞科技、中兴通讯发布国内首个光互连光交换 GPU 超节点光跃 LightSphere X,新华三推出 H3C UniPoD S80000 超节点,超聚变也展出了超节点方案。业内人士预计这波超节点热度会延续下去。

  超节点是一种应对大算力集群芯片协同问题的方案。通过整合算力芯片资源,在一个超节点内构建低延迟、高带宽的算力实体,让单个超节点尽可能大地释放算力,避免芯片空闲,提高算力利用效率,支撑千亿乃至万亿参数模型的训练和推理。

  即便是在单颗算力芯片制程受限的情况下,超节点技术也能让集群性能继续提升。壁仞科技 OCS 超节点项目相关负责人董朝锋告诉记者,在国内,做超节点已经是个明显的趋势,随着算力集群迈入 「万卡协同」 时代,探讨未来算力的构建范式演进非常重要。

  超节点为什么火了?

  从千卡集群到万卡集群、十万卡集群,算力芯片集群越来越大,是因为大模型越来越大,参数量已经迈向万亿。要怎么做好算力支撑,业内不得不思考这个问题。

  英伟达是较早布局超节点技术的代表厂商。英伟达 GB300 NVLink72 可以将 72 个 GPU 和 36 个 CPU 整合到单一平台。近期在布局超节点的国内厂商则包括 AI 芯片厂商和服务器厂商。

  有芯片业内人士向记者举例,一个万亿参数模型训练可能是这样的:粗略估算需要 1 万张 GPU,但为了具备容错能力,要有超过 1 万张 GPU。此外,要具备多个超节点,每个超节点内有几十张 GPU,超节点内部也有冗余、容错能力,包括秒级容错和分钟级故障恢复能力、调度能力。调度能力是指将万亿参数模型的训练分布到每个 GPU 上做并行计算。

  在这个万卡算力芯片集群中,超节点是一个很核心的概念。董朝锋告诉记者,如果单机 8 卡可以跑一个 70 亿参数的模型,当模型参数达到千亿、万亿,就需要更多 GPU 服务器。然而,传统 AI 服务器的 scale out(横向拓展) 互连由于线性度关系会导致算力性能的损失。在没有超节点的情况下,机柜之间由于线性度的影响会有算力性能损失,导致 「1+1」 无法等于 「2」。但如果有超节点,则能保证单个节点内的性能最优。

  有从业者告诉记者,如果没有超节点,一个机箱单机 8 卡,只能做到每 2 卡之间的带宽、通信延迟一致。董朝锋告诉记者,超节点有两条路线,一是 scale out 横向拓展,二是 scale up 纵向拓展。纵向拓展即在一个节点内尽可能多地增加 GPU,例如一个千卡集群中,每 64 卡是一个超节点,在这个超节点中,可以做到卡间、机间的通讯带宽、通讯基本一致。

  超节点技术中,光互连是主流方向之一,属于光通信范畴。光互连有全光交换、全光互连、光互连电交换路线。业内人士告诉记者,与光互连电交换相比,光互连光交换可以依托于光芯片,将电交换能力转化成光交换能力,光的切换是纳秒级,因此可以灵活切换拓扑且带宽较高。光通信可保证集群与集群之间高带宽、低延迟。

  此次上海仪电联合曦智科技、壁仞科技、中兴通讯发布的超节点方案就采用分布式光互连光交换技术,该方案使用曦智科技的光互连光交换芯片和壁仞科技的 GPU 液冷模组,搭载中兴通讯的 AI 服务器。新华三推出的超节点产品则基于以太协议和 PCIe 协议,可适用多种算力芯片,适用万亿级参数大模型训练和推理。此外,WAIC 上展出的华为昇腾384 超节点可通过总线技术实现 384 个 NPU(神经网络处理器) 之间的大带宽低时延互连。

  超节点在国内越来越受到关注,其背后,是因为超节点技术成为提升芯片制程之外,另一条能提高芯片集群性能的路径。随着摩尔定律面临 「失灵」 风险,推进芯片制程演进的难度增大,提升单颗芯片的计算性能面临挑战,业界需要寻找新的方法来继续提升算力。

  董朝锋告诉记者,在芯片提升制程之外,超节点技术是能让集群性能提升的方法之一。短期内,国产 AI 芯片在制程工艺上与世界顶尖水平存在客观差距,国内厂商可以通过超节点方案部署更大规模的芯片集群来弥补单点性能的不足,以量补质,也能通过超节点技术让集群性能继续提升。其中光芯片也可以不依赖于高制程。

  有业内人士告诉记者,英伟达的互连方案相对封闭,自有 GPU、配套软硬件,国内一些厂商则在做开放生态。相较英伟达全套自研的路线,国内还没有类似英伟达这样成系统的技术体系。近期国内很多厂商包括服务器厂商都在推广超节点,各家路线各不完全一样,还需要时间来证明技术优劣。总体而言,国内光通信技术在全球比较领先,与海外先进水平相比没有明显代差。

  应对市场竞争

  今年国产芯片在 AI 服务器中的占比已在提升。TrendForce 集邦咨询数据显示,去年国内 AI 服务器芯片中,外购部分 (包括英伟达、AMD) 所占市场份额为 63%。该机构最新预计,外购部分今年的占比将降至 49%。

  即便如此,海外芯片厂商仍重视中国市场。英伟达 CEO 黄仁勋在本月早些时候表示,英伟达将推出面向中国市场的全新 GPU。

  除了通过互连技术优化提升芯片集群的效率,国内芯片厂商在芯片设计、市场策略上也在寻找方法,应对市场竞争。

  墨芯人工智能此次在 WAIC 上展出了 S40 等计算卡。该公司相关负责人告诉记者,与英伟达的竞争不能只在产品性能上下功夫,还可以采取迂回竞争的策略。英伟达的 GPU 是通用型 GPU,可用于训练和推理,不会针对一些垂直行业专门作出改变,但国产芯片可以有一些改变。该公司的产品针对推理做了优化,集中面向 AI 推理场景,例如边缘计算一体机,在特定场景下可以有更快计算速度和更低功耗。

  上述公司相关负责人告诉记者,很多芯片厂商主要面向稠密计算需求,该公司则采用软硬件结合的策略,在软件算法上采用稀疏计算技术。与稠密计算的卡不同,面向稀疏计算的卡对制程的要求不高,可以采用 12nm 制程。目前公司的产品比较适用于特定场景的小模型运算,后续将推出的新产品则定义为广义稀疏的产品,适用于大模型计算。

  其他一些国产芯片厂商也避开了与海外 AI 芯片巨头的直接竞争。

  云天励飞同样选择了 AI 推理场景。该公司在 WAIC 期间宣布将全面聚焦 AI 芯片,未来将重点围绕边缘计算、云端大模型推理和具身智能领域布局。云天励飞董事长兼 CEO 陈宁表示,云侧推理更多考虑多用户并行情况下的芯片硬件采购成本、集群电费等运营成本,边缘计算则对芯片硬件采购成本更敏感,且更注重芯片与场景结合时的有效算力。他判断,以 AI 大模型和各类 AI 算法、推理芯片为核心的 AI 技术,将在未来五年重新定义人类所有的电子产品。

  后摩智能近日则推出新一代芯片,面向端边场景。该公司新一代端边大模型 AI 芯片后摩漫界 M50 在 INT8 精度下的算力为 160TOPS,在 bFP16 精度下的算力为 100TFLOPS。目前该公司的芯片面向平板、PC 等消费终端,以及智能语音会议系统、运营商边缘计算场景。该公司还采用存算一体技术,解决传统芯片数据传输慢、功耗较高的问题。

  后摩智能创始人、CEO 吴强表示,定位端边大模型计算,一定程度上避开了和巨头竞争高壁垒产品和已固化的市场,此外,还可以发挥存算一体技术的优势,在新兴的 AI PC、智能语音设备、具身智能等新兴赛道找到位置。

(第一财经)

文章转载自东方财富

YOU MAY ALSO LIKE

芝商所亚太区董事总经理拉塞尔·贝蒂:中国期货市场应加强与国际的互联互通

何小鹏:明年目标规模量产高阶人形机器人!Robotaxi 也要来了!

Search

没有结果
查看所有结果

一周热门

美国政府 「重开」 曙光初现?两党议员对结束停摆表示乐观

2025 年 11 月 6 日
安吉尔38年重构全屋净饮水市场  以长期主义引领技术、产品、渠道全面升维

安吉尔 38 年重构全屋净饮水市场 以长期主义引领技术、产品、渠道全面升维

2025 年 11 月 6 日

上市公司含 「科」 量进一步提高,关注 A500ETF 易方达 (159361)、科创板 50ETF(588080) 投资机会

2025 年 11 月 6 日

芝商所亚太区董事总经理拉塞尔·贝蒂:中国期货市场应加强与国际的互联互通

2025 年 11 月 6 日
何小鹏:明年目标规模量产高阶人形机器人!Robotaxi也要来了!

何小鹏:明年目标规模量产高阶人形机器人!Robotaxi 也要来了!

2025 年 11 月 6 日
苹果被爆大动作,售价或远低于1000美元!

苹果被爆大动作,售价或远低于 1000 美元!

2025 年 11 月 6 日

面对通胀担忧声浪 美联储米兰仍呼吁 「继续降息之路」

2025 年 11 月 6 日

新湖期货总经理金玉卫:以体系化创新践行 《意见》 精神

2025 年 11 月 6 日

「小非农」 超预期反弹,美国就业市场回暖?

2025 年 11 月 6 日
商品日报(11月5日):集运欧线强势续涨超4% 多晶硅两日累跌超5%

商品日报 (11 月 5 日):集运欧线强势续涨超 4% 多晶硅两日累跌超 5%

2025 年 11 月 6 日
金桂财经

2025 年 11 月
一 二 三 四 五 六 日
 12
3456789
10111213141516
17181920212223
24252627282930
« 10 月    

近期动态

  • 美国政府 「重开」 曙光初现?两党议员对结束停摆表示乐观
  • 安吉尔 38 年重构全屋净饮水市场 以长期主义引领技术、产品、渠道全面升维
  • 上市公司含 「科」 量进一步提高,关注 A500ETF 易方达 (159361)、科创板 50ETF(588080) 投资机会
  • 芝商所亚太区董事总经理拉塞尔·贝蒂:中国期货市场应加强与国际的互联互通
  • 何小鹏:明年目标规模量产高阶人形机器人!Robotaxi 也要来了!
  • 苹果被爆大动作,售价或远低于 1000 美元!
广告

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 关于本站
  • 联系我们
  • 隐私政策
没有结果
查看所有结果
  • 登录& 注册

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 登录
  • 注册
忘记密码?
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.
body::-webkit-scrollbar { width: 7px; } body::-webkit-scrollbar-track { border-radius: 10px; background: #f0f0f0; } body::-webkit-scrollbar-thumb { border-radius: 50px; background: #dfdbdb }