来源:
澎湃新闻
DeepSeek-V3.1 发布彻底引燃了国产算力供应链。
8 月 22 日,国产算力产业链起飞。算力芯片厂商寒武纪 (688256)、海光信息(688041)、云天励飞 (688343) 均 20CM 涨停,其中寒武纪市值突破 5200 亿元,海光信息市值突破 4300 亿元。
在算力芯片的带领下,国产算力供应链集体大涨。芯片代工的中芯国际(688981) 大涨近 15%。半导体设备端的北方华创(002371) 和中微公司(688012) 涨超 6%。华为算力供应链也有极好的表现,川润股份(002272)10% 涨停、方正科技(600601)10% 涨停。
消息面上,8 月 21 日,DeepSeek 正式发布 DeepSeek-V3.1。这款大模型为混合推理架构,同时支持思考模式与非思考模式。思考效率更高,相比 DeepSeek-R1-0528 能在更短时间给出答案。此外,新模型在工具使用与智能体任务中的表现有较大提升。新模型在智能体能力上实现突破。官方资料显示,在代码修复测评,命令行终端环境下的复杂任务测试中,DeepSeek-V3.1 有明显提高,并在多项搜索评测指标上取得较大进展。
此外,DeepSeek 还表示,DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的参数精度。UE8M0 FP8 是针对即将发布的下一代国产芯片设计。这也表明未来基于 DeepSeek 模型的训练与推理有望更多应用国产 AI 芯片,助力国产算力生态加速建设。
目前,国产算力芯片供应商主要有华为、海光信息、寒武纪以及沐曦、摩尔线程、燧原、天数智芯等。今年 2 月份,这些算力芯片都已经对外宣布适配 DeepSeek 的模型。
不过,澎湃新闻记者最新获悉,摩尔线程旗舰 AI 训推产品 MTT S5000 是国内首批原生支持 FP8 并已大规模量产的 GPU。摩尔线程的 MUSA 架构原生支持硬件 FP8 张量加速计算,能够很好地支持 UE8M0 FP8 Scale,利用硬件原生 FP8,相对于传统的 FP16 计算能够实现两倍的浮点算力提升、访存和通信带宽效率提升和存储容量利用率提升,同时最优化张量表达精度。
今年 2 月份,摩尔线程对外披露,自 DeepSeek 启动 「开源周」 以来,已陆续开源三个代码库。摩尔线程基于全新 MUSA Compute Capability 3.1 计算架构,可提供原生 FP8 计算能力,同时升级了高性能线性代数模板库 MUTLASS,快速支持了 FlashMLA。不仅如此,摩尔线程还基于 MUTLASS 在全新 GPU 架构上优化实现了 FP8 矩阵乘法,支持 DeepGEMM 的相应功能,充分展示了摩尔线程 MUSA 架构和全功能 GPU 在生态兼容与快速适配上的强大优势。
海光信息之前宣布海光 DCU(深度计算单元) 已成功完成与 DeepSeek V3 和 R1 模型的适配优化。DCU 是海光信息推出的高性能 GPGPU 架构 AI 加速卡,致力于为行业客户提供自主可控的全精度通用 AI 加速计算解决方案。DCU 已在科教、金融、医疗、政务、智算中心等多个领域实现规模化应用。
一位芯片行业人士表示,目前最新的 FP8,国产芯片都不太支持,接下来会分阶段进行支持。先是通过软件兼容,再逐步进行硬件原生支持。
针对 DeepSeek 更新模型,明确支持 FP8 精度和即将发布的下一代国产芯片,中信建投研报认为,头部国产开源模型对国产芯片的支持有望推动国产算力生态加速落地。
中信建投还提到,腾讯在业绩会上表示推理芯片的供应渠道侧具备多种选择,国际供应链波动背景下国产推理算力芯片有望提供助力。华为昇腾芯片近期陆续参与政府、金融、运营商等行业客户招投标产品中,印证国产芯片竞争力持续提升。
公开信息显示:8 月 12 日,2025 金融 AI 推理应用落地与发展论坛在上海举行。华为在本次论坛上推出 AI 推理创新技术——UCM 推理记忆数据管理器,旨在推动 AI 推理体验升级,提升推理性价比。
当前,人工智能已步入发展深水区,AI 推理正成为下一个爆发式增长的关键阶段。为保障流畅的推理体验,企业需持续加大算力投入,但如何在推理效率与成本之间找到最佳平衡点,成为了全行业亟待解决的重要课题。
华为推出 UCM 推理记忆数据管理器,包括对接不同引擎与算力的推理引擎插件 (Connector)、支持多级 KV Cache 管理及加速算法的功能库 (Accelerator)、高性能 KV Cache 存取适配器 (Adapter) 三大组件,通过推理框架、算力、存储三层协同,实现 AI 推理 「更优体验、更低成本」。
除了 DeepSeek 加大对国产算力芯片的支持外,还有消息称,英伟达已要求部分零部件供应商暂停生产 H20 芯片。
8 月 22 日,外交部发言人毛宁主持例行记者会。彭博社记者提问,据报道称,英伟达已要求部分零部件供应商暂停生产 H20 芯片。外交部对有关英伟达停止 H20 芯片生产的最新报道有何评论?对此,毛宁表示:「这个问题建议你向中方的主管部门了解。作为原则,我们一贯认为各方各国都应当共同维护全球产供链的稳定畅通。」
(澎湃新闻)
文章转载自东方财富




