• 最新
  • 热门
  • 所有
  • 外汇
  • 24 小时
  • 期货
  • 基金
  • 贵金属
  • 股票
英伟达发布超长上下文推理芯片Rubin CPX 算力效率拉爆当前旗舰

英伟达发布超长上下文推理芯片 Rubin CPX 算力效率拉爆当前旗舰

2025 年 9 月 10 日

以期货为翼:红枣小作坊蜕变为产业 「领头羊」

2025 年 11 月 4 日

四大证券报精华摘要:11 月 4 日

2025 年 11 月 4 日
我的第一个背单词小程序

我的第一个背单词小程序

2025 年 11 月 4 日
广告

新基金发行升温 权益类产品担当主力

2025 年 11 月 4 日

水贝金价突然飙涨!黄金税收新政改写行业格局

2025 年 11 月 4 日
美团「进攻宣言」落地:LongCat两个月发布四大模型 互联网AI从「炫技」卷向业务破壁

美团 「进攻宣言」 落地:LongCat 两个月发布四大模型 互联网 AI 从 「炫技」 卷向业务破壁

2025 年 11 月 4 日
利多来袭!菜粕期价大涨

利多来袭!菜粕期价大涨

2025 年 11 月 4 日
公募REITs二级市场延续回稳趋势,商业地产发行REITs迎政策利好

公募 REITs 二级市场延续回稳趋势,商业地产发行 REITs 迎政策利好

2025 年 11 月 4 日

衍生品破局:提升钢铁产业链韧性 助力现代化产业体系建设

2025 年 11 月 4 日

机构称 A 股仍需以科技成长领涨,关注科创综指 ETF 易方达 (589800)、科创板 50ETF(588080) 等投资机会

2025 年 11 月 4 日
AI「黄金浪潮」开启!华尔街集体唱多英伟达:8.5万亿美元市值可期

AI「黄金浪潮」 开启!华尔街集体唱多英伟达:8.5 万亿美元市值可期

2025 年 11 月 4 日
谷歌据悉拟发行至少30亿欧元债券 以支持AI扩张

谷歌据悉拟发行至少 30 亿欧元债券 以支持 AI 扩张

2025 年 11 月 4 日
金桂财经
广告
2025 年 11 月 4 日 星期二
联系我们
合作建议
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
  • 登录& 注册
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
没有结果
查看所有结果
金桂财经
没有结果
查看所有结果

英伟达发布超长上下文推理芯片 Rubin CPX 算力效率拉爆当前旗舰

来自 金桂财经
2025 年 9 月 10 日
在 全球
0

YOU MAY ALSO LIKE

AI「黄金浪潮」 开启!华尔街集体唱多英伟达:8.5 万亿美元市值可期

「股神」 这次会再卖飞吗?巴菲特 Q3 或进一步减持了苹果股票


K图 NVDA_0

  全球人工智能算力芯片龙头英伟达周二宣布,推出专为长上下文工作负载设计的专用 GPU Rubin CPX,用于翻倍提升当前 AI 推理运算的工作效率,特别是编程、视频生成等需要超长上下文窗口的应用。

  英伟达 CEO 黄仁勋表示,CPX 是首款专为需要一次性处理大量知识 (数百万级别 tokens),并进行人工智能推理的模型而构建的芯片。

  需要说明的是,Rubin 就是英伟达将在明年发售的下一代顶级算力芯片,所以基于 Rubin 的 CPX 预计也要到 2026 年底出货。下一代英伟达旗舰 AI 服务器的全称叫做 NVIDIA Vera Rubin NVL144 CPX——集成 36 个 Vera CPU、144 块 Rubin GPU 和 144 块 Rubin CPX GPU。

image

(NVIDIA Vera Rubin NVL144 CPX 机架与托盘,来源:公司博客)

  英伟达透露,搭载 Rubin CPX 的 Rubin 机架在处理大上下文窗口时的性能,能比当前旗舰机架 GB300 NVL72 高出最多 6.5 倍。

image

  据悉,下一代旗舰机架将提供 8exaFLOPs 的 NVFP4 算力,比 GB300 NVL72 高出 7.5 倍。同时单个机架就能提供 100TB 的高速内存和 1.7PB/s 的内存带宽。

  言归正传,英伟达之所以要在 Rubin GPU 边上再配一块 Rubin CPX GPU,自然是为了显著提升数据中心的算力效率——用户购买英伟达的芯片将能赚到更多的钱。英伟达表示,部署价值 1 亿美元的新芯片,将能为客户带来 50 亿美元的收入。

  为何需要不同的 GPU?

  作为行业首创之举,英伟达的新品在硬件层面上分拆了人工智能推理的计算负载。

  英伟达介绍称,推理过程包括两个截然不同的阶段:上下文阶段与生成阶段,两者对基础设施的要求本质上完全不同。

image

  上下文阶段属于计算受限 (compute-bound),需要高吞吐量的处理能力来摄取并分析大量输入数据,从而生成首个输出 token。相反,生成阶段则属于内存带宽受限 (memory bandwidth-bound),依赖高速的内存传输和高带宽互联 (如 NVLink),以维持逐个 token 的输出性能。

  当前顶级的 GPU 都是为了内存和网络限制的生成阶段设计,配备昂贵的 HBM 内存,然而在解码阶段并不需要这些内存。因此,通过分离式处理这两个阶段,并针对性地优化计算与内存资源,将显著提升算力的利用率。

  据悉,Rubin CPX 专门针对 「数百万 tokens」 级别的长上下文性能进行优化,具备 30petaFLOPs 的 NVFP4 算力、128GB GDDR7 内存。

  英伟达估计,大约有 20% 的 AI 应用会 「坐等」 首个 token 出现。例如解码 10 万行代码可能需要 5-10 分钟。而多帧、多秒的视频,预处理和逐帧嵌入会迅速增加延迟,这也是为什么当前的视频大模型通常仅用于制作短片。

  英伟达计划以两种形式提供 Rubin CPX,一种是与 Vera Rubin 装在同一个托盘上。对于已经下单 NVL144 的用户,英伟达也会单独出售一整个机架的 CPX 芯片,数量正好匹配 Rubin 机架。

image

(财联社)

文章转载自 东方财富

Search

没有结果
查看所有结果

一周热门

以期货为翼:红枣小作坊蜕变为产业 「领头羊」

2025 年 11 月 4 日

四大证券报精华摘要:11 月 4 日

2025 年 11 月 4 日
我的第一个背单词小程序

我的第一个背单词小程序

2025 年 11 月 4 日

新基金发行升温 权益类产品担当主力

2025 年 11 月 4 日

水贝金价突然飙涨!黄金税收新政改写行业格局

2025 年 11 月 4 日
美团「进攻宣言」落地:LongCat两个月发布四大模型 互联网AI从「炫技」卷向业务破壁

美团 「进攻宣言」 落地:LongCat 两个月发布四大模型 互联网 AI 从 「炫技」 卷向业务破壁

2025 年 11 月 4 日
利多来袭!菜粕期价大涨

利多来袭!菜粕期价大涨

2025 年 11 月 4 日
公募REITs二级市场延续回稳趋势,商业地产发行REITs迎政策利好

公募 REITs 二级市场延续回稳趋势,商业地产发行 REITs 迎政策利好

2025 年 11 月 4 日

衍生品破局:提升钢铁产业链韧性 助力现代化产业体系建设

2025 年 11 月 4 日

机构称 A 股仍需以科技成长领涨,关注科创综指 ETF 易方达 (589800)、科创板 50ETF(588080) 等投资机会

2025 年 11 月 4 日
金桂财经

2025 年 11 月
一 二 三 四 五 六 日
 12
3456789
10111213141516
17181920212223
24252627282930
« 10 月    

近期动态

  • 以期货为翼:红枣小作坊蜕变为产业 「领头羊」
  • 四大证券报精华摘要:11 月 4 日
  • 我的第一个背单词小程序
  • 新基金发行升温 权益类产品担当主力
  • 水贝金价突然飙涨!黄金税收新政改写行业格局
  • 美团 「进攻宣言」 落地:LongCat 两个月发布四大模型 互联网 AI 从 「炫技」 卷向业务破壁
广告

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 关于本站
  • 联系我们
  • 隐私政策
没有结果
查看所有结果
  • 登录& 注册

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 登录
  • 注册
忘记密码?
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.
body::-webkit-scrollbar { width: 7px; } body::-webkit-scrollbar-track { border-radius: 10px; background: #f0f0f0; } body::-webkit-scrollbar-thumb { border-radius: 50px; background: #dfdbdb }