上证报 11 月 16 日获悉,华为将于本周举办 2025 AI 容器应用落地与发展论坛,会上将发布 AI 领域突破性技术成果,相关技术有望解决算力资源利用效率难题。
据透露,该技术延续 「以软件补硬件」 的创新思路,可将 GPU、NPU 等算力资源利用率从行业平均 30%-40% 大幅提升至 70%,显著释放算力硬件潜能。
据了解,华为这项新技术将对标英伟达2024 年底收购的以色列公司 Run: ai 的核心技术,旨在通过软件创新,实现英伟达、昇腾以及其他三方算力的统一资源管理与利用,「屏蔽」 算力硬件差异,为 AI 训练推理提供更高效的资源支撑。
2024 年 12 月,英伟达宣布以 7 亿美元 (约合人民币 51 亿元) 价格,收购 2018 年成立的以色列公司 Run:ai。Run:ai 的核心产品是基于 kubernetes(开源容器编排平台) 构建的软件平台,用于调度 GPU 的计算资源,通过动态调度、池化、分片等技术,实现 GPU 资源利用率的优化,让深度学习训练与推理任务在企业级环境中高效运行。
在先进制程受限、单颗芯片算力与国外有差距的背景下,华为积极软件创新上使力,希望通过 「以系统补单点」「以软件补硬件」,弥补芯片方面的不足。11 月 11 日,华为公布的第六届 「十大发明」 评选结果里,排名第一的 Scale-up 超大规模超节点算力平台就是用系统架构和互联技术弥补单芯性能短板的技术之一。
上述发明将超节点内的异构并行处理器、CPU、内存、存储等资源,通过高速互联总线形成全对等互联架构,实现共享内存池;资源可根据不同的任务需求,像搭积木一样进行灵活调配组合,实现了 「一切皆对等、一切皆可池化、一切皆可组合」,使数百、数千个 AI 处理器联接起来,像一台计算机一样工作、学习、思考、推理。
(上海证券报)
文章转载自 东方财富


