【TechWeb】7 月 23 日消息,据媒体报道,马斯克在社交媒体上宣布,旗下 AI 初创公司 xAI 已开始在位于田纳西州的所谓孟菲斯超级集群 (training cluster) 上进行训练,号称这是 「全球最强大的 AI 训练集群」。
据马斯克介绍,这个集群由 100,000 个液冷 H100 GPU 组成,这些芯片是英伟达去年开始提供的。
马斯克还表示,该集群在单个 RDMA 结构 (即远程直接数据存取结构) 上运行。据思科介绍,这种结构可以在计算节点之间提供更高效、更低延迟的数据传输,而不会给中央处理器 (CPU) 带来负担。
马斯克今年 5 月曾透露这一计划 ,将英伟达 H100 串联到一台巨型的超级计算机中,并称其为 「算力超级工厂」。马斯克旗下特斯拉的汽车工厂也被称之为超级工厂 (Gigafactory)。
xAI 的目标是到 2024 年 12 月训练出 「按每项指标衡量都是全球最强大的 AI」。马斯克表示,孟菲斯超级集群将为实现这一目标提供 「显著优势」。
不过,外媒表示,不要对这一时间节点报太大期望,因为马斯克以公开提出并错过许多项目 (如全自动驾驶汽车、无人驾驶出租车产品 Robotaxi 和将人类送往火星) 的最后期限而闻名。
马斯克周一还表示,特斯拉将在明年小规模生产用于内部使用的 Optimus 机器人,并希望到 2026 年能大规模生产供其他公司使用。这比他之前承诺的时间表晚了。之前马斯克宣称到 2024 年底将在特斯拉工厂使用 Optimus 机器人,并在 2025 年交付给其他公司。
另外,微软正在与 OpenAI 首席执行官 Sam Altman(阿尔特曼) 合作开发一个价值 1000 亿美元的 AI 训练超级计算机,代号为 Stargate。如果这一项目取得成功,xAI 的孟菲斯超级集群可能不会长期保持全球最强大的 AI 训练集群地位。