来源:
财联社
国产 GPU 领军企业摩尔线程 (688795.SH) 的生态版图正在加速扩张。
12 月 20 日,摩尔线程在北京举办首届 「MUSA 开发者大会」(MDC 2025),创始人、董事长兼 CEO 张建中介绍了公司研发历时五年的核心成果——新一代全功能 GPU 架构 「花港」。
在长达数小时的主题演讲中,张建中将 「全功能」 视作摩尔线程的技术底座。
他认为,全功能 GPU 的创新本质是一部算力进化史,这意味着 GPU 芯片可以处理大部分的数据单元和格式。此次发布的 「花港」 架构采用新一代指令集,算力密度较上一代提升了 50%,能效则提升了 10 倍,将于明年实现量产。
值得注意的是,「花港」 架构实现了从 FP4 到 FP64 全精度的支持,并在图形技术上集成了第一代 AI 生成式渲染架构 (AGR) 和第二代光线追踪硬件加速引擎。
基于 「花港」 架构,摩尔线程同步公布了两款核心芯片规划。
主打 AI 训推一体、超智融合的 「华山」 以及专攻高性能图形渲染的 「庐山」。
据现场披露的信息,「华山」 芯片内置了新一代异步编程模型,具备高效线程同步和线程束特化特性,在张量计算方面,该芯片拥有全精度 MMA,并配备了摩尔线程 MTFP8/6/4 混合低精度计算技术。
而另一款芯片 「庐山」 则重点优化了任务分配与平衡,其 AI 计算性能较前代提升了 64 倍,几何处理性能提升 16 倍,并完整支持 DirectX 12 Ultimate。
芯片的迭代最终需落实到大规模工程化应用中。
在智算中心建设成为产业刚需的背景下,摩尔线程现场发布了 「夸娥」 万卡智算集群。
该集群的浮点运算能力达到 10Exa-Flops,在实际运行表现上,该万卡集群在 Dense 大模型上的训练算力利用率 (MFU) 达到 60%,在 MOE 大模型上为 40%,有效训练时间占比超过 90%。
针对当前市场关注度极高的推理性能,摩尔线程展示了其与硅基流动的合作成果。
在 DeepSeek R1 671B 全量模型上,摩尔线程 MTT S5000 单卡的 Prefill 吞吐量突破了 4000 tokens/s,Decode 吞吐量突破 1000 tokens/s。这一数据意味着国产 GPU 在处理超大规模参数模型时,已在系统级工程优化上取得了实质性突破。
与此同时,摩尔线程还分享了面向下一代智算中心的 MTT C256 超节点架构规划,旨在通过高密硬件设计进一步提升集群能效。
软件生态的兼容性一直被视为国产 GPU 的命门。
张建中在会上宣布,公司自研的 MUSA 架构迎来全栈软件升级,升级后的 MUSA 5.0 在全栈统一性和效能上均有突破,其中,核心计算库 muDNN 的 GEMM/FlashAttention 效率超过 98%,通信效率达 97%。
摩尔线程还明确了开源计划,将逐步向开发者社区开放计算加速库、通信库及系统管理框架的核心组件。
此外,公司计划推出兼容跨代 GPU 指令架构的中间语言 MTX,以及面向渲染与 AI 融合计算的编程语言 muLang,以降低开发者的适配门槛。
在本次大会上,摩尔线程还做出了一项出乎市场预料的举动,正式进军个人智算终端硬件领域。
张建中在现场介绍了公司首款 AI 算力本 MTT AIBOOK,售价为 9999 元 (32GB+1TB 版本),预计于 2026 年 1 月 10 日开售。
这款笔记本搭载了摩尔线程自主研发的智能 SoC 芯片 「长江」,该 SoC 集成高性能全大核 CPU 及全功能 GPU,异构 AI 算力达 50TOPS。
从产品逻辑来看,MTT AIBOOK 更像是摩尔线程为 20 万名开发者提供的 「开箱即用」 工具,该设备内置 AI 智能体和 2D 数字人「小麦」,支持 0.5 秒内生成数字人形象,并预装了 Qwen3-8B 大模型。
通过支持 Windows、Linux、安卓容器及所有国产操作系统,摩尔线程试图将其 MUSA 生态从云端中心下沉到开发者的桌面端,实现代码调试与应用开发的闭环。
中国工程院院士郑纬民在大会现场指出,发展 「主权 AI」 的核心在于算力自主、算法自强与生态自立。
他认为,虽然构建国产十万卡级别的智算系统存在极大挑战,但这是必须完成的产业基础设施任务,郑纬民特别强调,国产芯片平台必须构建起易用的开发环境,才能真正留住开发者社群。
在资本市场表现方面,作为 「国产 GPU 第一股」,摩尔线程近期的股价呈现出明显的波动性。
受多重因素影响,公司股价在 12 月 19 日收报 664.10 元/股,跌幅为 5.9%。相较于 12 月 11 日的高点,其股价累计跌幅已达 29.4%,然而,若以发行价衡量,该股目前的涨幅仍超过 481%,公司总市值依然维持在 3121.46 亿元的高位。
目前,全球算力市场正处于从单纯追求参数规模向追求推理效能和生态落地的转型期。
摩尔线程通过此次大会展示的 「花港」 架构及 「芯-边-端-云」 全栈体系,反映出其试图摆脱单一硬件供应商身份,转向平台级算力基础设施商的战略意图。
在万卡集群效率和 DeepSeek 模型推理上的实测数据,为其在资本密集的算力长跑中增添了筹码。

(财联社)
文章转载自东方财富


