来源:
财联社
就在全球瞩目的财报公开前夕,英伟达又秀了一把肌肉:把下一代 Vera Rubin 算力系统打开,讲解即将带来 「10 倍算力」 浪潮的新硬件有哪些看头。
在最新媒体采访中,英伟达 AI 基础设施负责人 Dion Harris 在加州总部展示了完整 Vera Rubin 机架的内部构成和供应商细节。Dion 表示,除了 72 颗 Rubin 图形处理单元 (GPU) 和 36 颗 Vera 中央处理器 (CPU) 外,整套机架总共有 130 万个组件,由来自中国、越南、泰国等 20 多个国家和地区的 80 多家供应商提供。
Harris 介绍称,由于系统的组件众多,所以英伟达设计了统一的标准参考设计,然后交给全球供应商一起生产。例如,光是连接软管末端的喷嘴就有十余个供应商。

英伟达还展示了其他组件的供应商。例如提供连接器的安费诺和维谛技术的冷却液分配单元;电源托架由 Megumi、光宝科技或伟创力提供;电源及功率器件来自英飞凌、亚德诺半导体及意法半导体;机箱由富士康或 Interplex 供应,母线由贸联 (BizLink) 提供,机架液冷歧管由品达负责;液冷冷板则来自技嘉、AVC、Boyd 及酷冷至尊;电源线束供应商还有 JPC、Recodeal 等。

英伟达透露,新系统的功耗约为前代的两倍,但由于每瓦性能较 Blackwell 的提升达到 10 倍,整体算力的能效比将实现跃升。
正是由于功耗上升,Vera Rubin 也是英伟达首个 100% 液冷散热的系统。Harris 介绍称,英伟达已经建议客户,未来的人工智能工厂将绝大部分采用液冷架构。由于液冷闭环的特性,新设计还能节约水资源。

Harris 也展示了数据传输速度翻倍至每秒 260TB 的 NVLink 芯片和机架主干。在单个机架中,就需要 5000 根铜缆将整套设备连接在一起,总长度约为两英里。

他也介绍称,Vera Rubin 在简化维护成本方面也下了功夫。例如更换 Blackwell 机架计算托盘的工序需要两个小时,而新系统只需要 5 分钟。另外,系统中的 SO-CAM 低功耗内存也能单独插入和拆卸,而不是焊死在主板上。
不过对于内存短缺的影响,Harris 并未给出正面回应。他仅表示,英伟达会向供应商提供非常详细的预测,来协调供应链能够满足出货需求,而目前 「状况良好」。
最后,Harris 也展示了英伟达下一代大型机架 Kyber 的原型。新机架搭载的 GPU 数量将从现在的 72 块提升至 288 块,但重量仅增加约 50%,部分原因是精简了布线设计。英伟达 Vera Rubin Ultra 系统将采用 Kyber 机架,预计于 2027 年上市。


(财联社)
文章转载自东方财富



