• 最新
  • 热门
  • 所有
  • 外汇
  • 24 小时
  • 期货
  • 基金
  • 贵金属
  • 股票

AI 算力需求涌向模型推理 国产芯片站上竞技台

2025 年 5 月 28 日
攸关全球贸易命运!美最高法院同意加快审理关税案 11月初口头辩论

攸关全球贸易命运!美最高法院同意加快审理关税案 11 月初口头辩论

2025 年 9 月 10 日
特朗普罢免令被禁!库克的美联储理事「宝座」暂时保住了

特朗普罢免令被禁!库克的美联储理事 「宝座」 暂时保住了

2025 年 9 月 10 日

指增型 ETF 人气渐涨!500 增强 ETF(561550) 最新规模创成立以来新高!

2025 年 9 月 10 日
广告
十四届全国人大常委会第十七次会议举行第二次全体会议 审议执法检查报告、专项工作报告等

十四届全国人大常委会第十七次会议举行第二次全体会议 审议执法检查报告、专项工作报告等

2025 年 9 月 10 日
知情人士:农业农村部畜牧兽医局拟于9月16日召开生猪产能调控企业座谈会 25家头部企业参会

知情人士:农业农村部畜牧兽医局拟于 9 月 16 日召开生猪产能调控企业座谈会 25 家头部企业参会

2025 年 9 月 10 日
美国就业增长「神话」破灭:非农修正幅度创史上之最

美国就业增长 「神话」 破灭:非农修正幅度创史上之最

2025 年 9 月 10 日
历史首次!美国总统解雇美联储理事被法院叫停

历史首次!美国总统解雇美联储理事被法院叫停

2025 年 9 月 10 日

马克龙两年换五相 谁可能接下法国总理这一 「烫手山芋」?

2025 年 9 月 10 日
热门方向 大举吸金!

热门方向 大举吸金!

2025 年 9 月 10 日
A股三大指数收涨:创业板指涨逾1% 成交额跌破2万亿

A 股三大指数收涨:创业板指涨逾 1% 成交额跌破 2 万亿

2025 年 9 月 10 日
突发警告!高盛最新发声!美国经济增长停滞 需多次降息

突发警告!高盛最新发声!美国经济增长停滞 需多次降息

2025 年 9 月 10 日

南华期货:协同创新合作,打通期市对外开放的关键节点

2025 年 9 月 10 日
金桂财经
广告
2025 年 9 月 10 日 星期三
联系我们
合作建议
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
  • 登录& 注册
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
没有结果
查看所有结果
金桂财经
没有结果
查看所有结果

AI 算力需求涌向模型推理 国产芯片站上竞技台

来自 金桂财经
2025 年 5 月 28 日
在 24 小时
0

作者:
郑栩彤

  刚刚结束的 COMPUTEX 电脑展上,英伟达CEO 黄仁勋笑着对听众说,「你 (芯片) 买得越多,赚得越多。」 引来一阵笑声。

  这句话的背景是,全球科技厂商在 AI 热潮下继续重金投入建设数据中心或算力中心。黄仁勋在演示文档上写着,英伟达正在驱动全球万亿美元级别的企业 AI IT 投资。

  数据中心建设热潮下,现在看来,AI 算力需求的变化与年初一些业内人士预计的不太一样。DeepSeek 对训练算力资源的节约,并未让整体算力需求减少。

  不过,还有一个变化发生了,随着 DeepSeek 推动 AI 走向应用,用于推理的 AI 芯片占比正在升高。

  市场研究机构 IDC 中国副总裁周震刚告诉第一财经记者,2024 年中国数据中心加速卡中已有半数以上是推理卡,DeepSeek 出现后,今年推理芯片占比预计还会增加。

  这种芯片结构变化,可能会对 AI 芯片市场造成深远影响,特别是在中国市场。推理环节对 AI 芯片性能等的要求较低,国产 AI 芯片也可以使用,在英伟达出口受到限制的情况下,可能促成国内 AI 芯片的组成发生变化。

  周震刚透露,去年国内数据中心加速卡市场中,国产算力占比大约三成,预计今年上半年占比应该会超四成。

  第一财经记者了解到,这波数据中心或算力中心建设潮中,需求方来自高校、企业等,AI 应用十分多元。而面向算力需求的变化,已有算力中心在计划调整芯片,使芯片组成更加多元、向模型推理倾斜。

  算力需求来自哪里

  数据中心或算力中心建设还在进行。IDC 数据显示,中国加速计算服务器市场出货量 2024 年同比增长 97.3%,预计 2025 年增长 52.9%。

  在中国招标投标公共服务平台,第一财经记者以智算中心为关键词搜索中标信息发现,截至今年 5 月 26 日,今年国内智算中心中标信息 123 条,是去年前 5 个月的 2.2 倍。这些信息围绕智算服务器设备采购、运维服务、电力模块采购、勘探、基建供配电工程施工等。

  从中标信息数量看,国内智算中心建设提速是持续的过程。2023 年国内智算中心中标信息 53 条,2024 年猛增至 213 条。2024 年上半年中标信息 71 条,下半年增加至 142 条,显示当年建设项目也在增多。

  记者了解到,一些企业和高校有了更多算力需求,部分高校自购算力卡,部分购买云算力或超算中心算力。

  香港科技大学冯诺依曼研究院院长贾佳亚告诉第一财经记者,学校此前购买了一批英伟达 H800 计算卡,香港只有香港科技大学有相对较多的 H800,这是能将该研究院做成较大规模的背景。即便如此,有算力提供方告诉记者,该校在训练大模型,需求比较大,自己的算力不够,也需要其他算力来源。

  近日华东理工大学则与腾讯云合作,推动 AI 与学科融合及科学研究降本增效等。该校副校长王慧锋告诉记者,高校科研对 AI 算力的需求增长是必然,该校也在探索 AI+科学研究,例如有化学老师将 AI 算法用于锂电池催化设计,并将设计理念提炼出来做成智能体知识库,用于实践教学。目前学校采用混合云架构,部分算力本地化部署,另有大量计算放到云上,上云而不是完全自建机房的做法成本更优。王慧锋告诉记者,考虑到需求和数据安全等,目前高校采用私有和混合架构的模式是主流。

  去年 12 月,香港规模最大的数码港人工智能超算中心投入服务,香港为申请使用者提供资助。记者了解到,申请使用该超算中心首阶段算力的主体就包括大学和科研机构。

  数码港行政总裁郑松岩告诉记者,该超算中心目前有 1300PFLOPS 算力,第二阶段规划算力是 1700PFLOPS,今年 10 月该超算中心算力将提升到 3000PFLOPS。目前已审批通过 10 个申请,这些申请来自大学、科研机构、企业,用途包括学术研究、生物医疗、材料分析、大模型应用等,到本月底,第一阶段的算力使用率将超 95%,预计接下来的申请会越来越多。

  「一些大学在做教学相关项目,一些在研究可商业化的项目。有的大学在研究生物科学相关领域,也需要比较大的算力。目前不少大学是以开发项目为主来申请,个别大学会捆绑几个小项目一起申请,让学生做一些研究。现在有算力基本是先到先得。」 郑松岩表示。

  企业也需要算力。郑松岩告诉记者,企业应用处于刚开始尝试的阶段,可以感受到很多企业还没有下很大决心要完成整个机构的转型,或为此拟定非常严格的时间节点。「前段时间处于一种想用 AI,但很多企业还没启动的阶段。很多企业都想用 AI 来提高效率、降低成本,但 AI 要直接嵌入企业日常流程中,企业实际上缺乏相应人才配套。」 郑松岩表示,香港的人工智能应用爆发期还没到来,随着业界对 AI 越来越熟悉,接下来预计应用会越来越多。

  算力向推理倾斜

  DeepSeek 带来的算力需求增长,是大模型推理对大模型训练的一场 「胜利」。过去两年,大模型业界最受关注的一直是训练环节。但开源且性能出众的 DeepSeek-R1 面世后,更多人开始真正将大模型用起来,促使推理需求增长。

  这让一些适合推理的芯片用了起来。周震刚向记者表示,去年国内互联网公司、电信运营商采购了大量国产算力卡,但去年采购方发现,国产算力资源不是很好出售。而随着今年上半年 DeepSeek 应用推开,尤其是国产算力适配 DeepSeek 后,此前它们采购的国产算力在今年第一季度已经被 DeepSeek 占有了。目前电信运营商已在建设新的大规模算力中心,包括基于国产算力的万卡集群。

  腾讯是国内最早接入 DeepSeek 的互联网厂商之一。该公司在 5 月的业绩交流会上释放过推理需求增长的信号。

  腾讯管理层表示,腾讯有足够的高端芯片来继续训练模型,公司看到对 GPU 更大的需求是在推理侧。用户推理需求逐渐增长,推理 token(词元) 的需求比之前预计的更多,AI 需求已经超过了 GPU 资源 (所能提供的算力)。

  周震刚也发现,DeepSeek 出现确实让算力需求改变了,主要是改变了算力需求的结构。他告诉记者,2024 年,中国数据中心加速卡有 57.6% 是推理卡,33% 是训练卡。而在 DeepSeek 出现后,一些小型公司的算力从训练转到推理。腾讯、百度这类平台接入 DeepSeek 也大大推动了推理芯片的增长,因此预计 2025 年推理芯片占比还会进一步大幅增加。

  郑松岩告诉记者,数码港的人工智能超算中心也在考虑改变算力组成。

  「一开始我们主要面向模型训练需求,包括很多大学那时候要做模型训练,但实际上,近一年来模型变化很大。」 郑松岩告诉记者,此前很多机构在做基础大语言模型,但在 DeepSeek 出来后放弃了这一路线,转向使用 DeepSeek 等基础大模型,「我们认为未来做基础大模型的团队会逐渐减少,转向以推理为主,人工智能超算中心的第二阶段正在建构中,接下来做安装、配置、设计时会更多考虑这部分需求。」

  郑松岩告诉记者,推理环节对芯片算力的要求相对没那么大,因此,算力不及英伟达 H100、H800 的芯片都有可能引进。

  芯片组成变了

  推理需求增长让国产算力站上竞技的舞台了。

  周震刚告诉记者,2022 年和 2023 年,英伟达占中国数据中心加速卡市场的 85%~90%,国产算力没有太大空间,但在美国政策、国内市场变化等因素影响下,国产算力占比已有大幅提升。

  具体而言,2024 年中国数据中心加速卡市场中,有 65.2% 是英伟达,34.6% 是国产算力。「我们现在看到,今年上半年国产算力占比应该会超四成,很可能在很短的时间内,国产算力会成为主流,占比超 50%。这个比例在两年前是无法想象的。」 周震刚表示。

  在大模型算力需求以训练为主的时候,之所以国产芯片还难以挑战英伟达的地位,既有英伟达芯片算力高、生态好、集群大等原因,也有训练难以兼容异构芯片的原因。周震刚向记者解释,训练时难以同时用英伟达+国产芯片组成的资源池,只能将训练分成两部分,一部分用英伟达卡,一部分用国产卡,但这种训练的效率较低,因此大部分训练现在仍跑在英伟达卡上,只有少数 AI 厂商基于国产卡算力平台,更多厂商还是在用国产芯片做测试性工作,作为备用方案。但推理可以跑在国产芯片上,「可以根据需求,把面向某个应用的推理或面向某个区域用户的推理放到国产芯片上,可以这么分解。」

  「过去别人会问 (国产芯片厂商),你跟英伟达 H100 相比优势在哪里、性价比如何、生态能否兼容?现在这些问题已经没有太大影响了。」 有业界分析人士向记者形容,云厂商或 AI 厂商现在需要英伟达之外的更多国产芯片方案。除了华为与运营商合作,其他国内芯片厂商也基本都有芯片出来了,云厂商也在推进自研。周震刚表示,今年一季度需求火热的 DeepSeek 一体机中,英伟达芯片占比还是较大,但已有不少基于寒武纪、沐曦等国产芯片。

  需求也反映在国产 AI 芯片厂商业绩上。此前陷于亏损的寒武纪,2024 年第四季度开始盈利。今年第一季度,寒武纪营收 11.11 亿元,接近去年全年营收,净利润 3.55 亿元,实现同比扭亏。

  还有算力中心正在考虑国产芯片方案,郑松岩告诉记者,推理不需要用到太 「高级」 的芯片。数码港有一个人工智能实验室,正在测试不同的芯片,除了英伟达,还测试国产的华为、沐曦、壁仞、昆仑芯等。同时,实验室也在测试异构算力调度平台,希望能通过一个平台统一调度不同芯片算力。

  腾讯高管则在 5 月的业绩交流会上表示,公司会同时看进口芯片和国内市面上可用的芯片,在某些情况下,其中一些芯片能做较小模型的推理。

  作为 AI 芯片巨头,英伟达近期感到紧张不是没有道理的。今年 4 月,英伟达公告称,美国政府已告知,对于 H20 芯片及达到 H20 内存带宽等的其他芯片,若出口至中国等国家和地区需获得许可证。H20 是英伟达针对中国市场推出的 「特供」 版本。

  黄仁勋近日表态称,这种人工智能芯片出口管制是失败的,「事实证明,最初制定人工智能扩散规则的那些基本假设存在根本性缺陷」。他表示,英伟达在中国市场的份额已从美国前总统拜登执政初期的 95% 降至目前的 50%。中国人工智能市场规模可能在未来两到三年内达到约 500 亿美元,对一家美国公司来说,无法进入这一市场将是巨大的损失。

  英伟达还在尝试应对中国市场上的竞争。近日有消息称,英伟达拟新推出一款面向中国市场的 AI 芯片,采用最新的 Blackwell 架构,定价低于 H20,最早于今年 6 月量产,英伟达官方尚未证实该消息。

(第一财经)

文章转载自东方财富

YOU MAY ALSO LIKE

十四届全国人大常委会第十七次会议举行第二次全体会议 审议执法检查报告、专项工作报告等

A 股三大指数收涨:创业板指涨逾 1% 成交额跌破 2 万亿

Search

没有结果
查看所有结果

一周热门

攸关全球贸易命运!美最高法院同意加快审理关税案 11月初口头辩论

攸关全球贸易命运!美最高法院同意加快审理关税案 11 月初口头辩论

2025 年 9 月 10 日
特朗普罢免令被禁!库克的美联储理事「宝座」暂时保住了

特朗普罢免令被禁!库克的美联储理事 「宝座」 暂时保住了

2025 年 9 月 10 日

指增型 ETF 人气渐涨!500 增强 ETF(561550) 最新规模创成立以来新高!

2025 年 9 月 10 日
十四届全国人大常委会第十七次会议举行第二次全体会议 审议执法检查报告、专项工作报告等

十四届全国人大常委会第十七次会议举行第二次全体会议 审议执法检查报告、专项工作报告等

2025 年 9 月 10 日
知情人士:农业农村部畜牧兽医局拟于9月16日召开生猪产能调控企业座谈会 25家头部企业参会

知情人士:农业农村部畜牧兽医局拟于 9 月 16 日召开生猪产能调控企业座谈会 25 家头部企业参会

2025 年 9 月 10 日
美国就业增长「神话」破灭:非农修正幅度创史上之最

美国就业增长 「神话」 破灭:非农修正幅度创史上之最

2025 年 9 月 10 日
历史首次!美国总统解雇美联储理事被法院叫停

历史首次!美国总统解雇美联储理事被法院叫停

2025 年 9 月 10 日

马克龙两年换五相 谁可能接下法国总理这一 「烫手山芋」?

2025 年 9 月 10 日
热门方向 大举吸金!

热门方向 大举吸金!

2025 年 9 月 10 日
A股三大指数收涨:创业板指涨逾1% 成交额跌破2万亿

A 股三大指数收涨:创业板指涨逾 1% 成交额跌破 2 万亿

2025 年 9 月 10 日
金桂财经

2025 年 9 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
2930  
« 8 月    

近期动态

  • 攸关全球贸易命运!美最高法院同意加快审理关税案 11 月初口头辩论
  • 特朗普罢免令被禁!库克的美联储理事 「宝座」 暂时保住了
  • 指增型 ETF 人气渐涨!500 增强 ETF(561550) 最新规模创成立以来新高!
  • 十四届全国人大常委会第十七次会议举行第二次全体会议 审议执法检查报告、专项工作报告等
  • 知情人士:农业农村部畜牧兽医局拟于 9 月 16 日召开生猪产能调控企业座谈会 25 家头部企业参会
  • 美国就业增长 「神话」 破灭:非农修正幅度创史上之最
广告

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 关于本站
  • 联系我们
  • 隐私政策
没有结果
查看所有结果
  • 登录& 注册

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 登录
  • 注册
忘记密码?
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.
body::-webkit-scrollbar { width: 7px; } body::-webkit-scrollbar-track { border-radius: 10px; background: #f0f0f0; } body::-webkit-scrollbar-thumb { border-radius: 50px; background: #dfdbdb }