英伟达大秀下一代 AI 系统 Vera Rubin 内部细节每瓦性能提高 10 倍

来源：
财联社

　　就在全球瞩目的财报公开前夕，英伟达又秀了一把肌肉：把下一代 Vera Rubin 算力系统打开，讲解即将带来「10 倍算力」浪潮的新硬件有哪些看头。

　　在最新媒体采访中，英伟达 AI 基础设施负责人 Dion Harris 在加州总部展示了完整 Vera Rubin 机架的内部构成和供应商细节。Dion 表示，除了 72 颗 Rubin 图形处理单元（GPU）和 36 颗 Vera 中央处理器（CPU）外，整套机架总共有 130 万个组件，由来自中国、越南、泰国等 20 多个国家和地区的 80 多家供应商提供。

　　Harris 介绍称，由于系统的组件众多，所以英伟达设计了统一的标准参考设计，然后交给全球供应商一起生产。例如，光是连接软管末端的喷嘴就有十余个供应商。

　　英伟达还展示了其他组件的供应商。例如提供连接器的安费诺和维谛技术的冷却液分配单元；电源托架由 Megumi、光宝科技或伟创力提供；电源及功率器件来自英飞凌、亚德诺半导体及意法半导体；机箱由富士康或 Interplex 供应，母线由贸联（BizLink）提供，机架液冷歧管由品达负责；液冷冷板则来自技嘉、AVC、Boyd 及酷冷至尊；电源线束供应商还有 JPC、Recodeal 等。

　　英伟达透露，新系统的功耗约为前代的两倍，但由于每瓦性能较 Blackwell 的提升达到 10 倍，整体算力的能效比将实现跃升。

　　正是由于功耗上升，Vera Rubin 也是英伟达首个 100% 液冷散热的系统。Harris 介绍称，英伟达已经建议客户，未来的人工智能工厂将绝大部分采用液冷架构。由于液冷闭环的特性，新设计还能节约水资源。

　　Harris 也展示了数据传输速度翻倍至每秒 260TB 的 NVLink 芯片和机架主干。在单个机架中，就需要 5000 根铜缆将整套设备连接在一起，总长度约为两英里。

　　他也介绍称，Vera Rubin 在简化维护成本方面也下了功夫。例如更换 Blackwell 机架计算托盘的工序需要两个小时，而新系统只需要 5 分钟。另外，系统中的 SO-CAM 低功耗内存也能单独插入和拆卸，而不是焊死在主板上。

　　不过对于内存短缺的影响，Harris 并未给出正面回应。他仅表示，英伟达会向供应商提供非常详细的预测，来协调供应链能够满足出货需求，而目前「状况良好」。

　　最后，Harris 也展示了英伟达下一代大型机架 Kyber 的原型。新机架搭载的 GPU 数量将从现在的 72 块提升至 288 块，但重量仅增加约 50%，部分原因是精简了布线设计。英伟达 Vera Rubin Ultra 系统将采用 Kyber 机架，预计于 2027 年上市。

（财联社）

文章转载自东方财富

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28