每经记者|朱成祥 每经编辑|金冥羽 陈旭
记者|朱成祥
编辑|金冥羽 陈旭 杜波 校对|许绍航
当下,AI 大模型正处于从生成式 AI 走向代理式 AI 的关键时刻。在此背景下,腾讯、阿里等厂商不惜大发红包以争夺用户。
在大模型厂商红包大战尚未分出胜负之际,算力租赁厂商却成为当下实实在在的赢家。正如服饰品牌李维斯的故事那般,最终赢家不是在加州挖金子的矿工,而是卖牛仔裤的李维斯。在这一轮大模型红包大战中,算力租赁赚得盆满钵满。
2 月 11 日,云计算服务商优刻得发布涨价公告。在被问及具体哪些产品涨价时,优刻得相关工作人员告诉 《每日经济新闻》 记者 (以下简称每经记者),「全线产品 (都会上涨),具体会根据客户资源使用情况给出方案。」
值得一提的是,宣布涨价后,优刻得昨日股价高开高走,收涨 20%。
红包大战带来对 AI 基础设施的巨大需求
2015 年除夕,微信支付凭借摇一摇抢红包,迅速爆发。而这一波,腾讯元宝发红包之后,阿里巴巴、百度、字节跳动也纷纷下场。
红包大战,也使得对 AI 基础设施的需求大增。
近日,国内云服务厂商优刻得宣布,因全球供应链波动持续加剧,核心硬件采购等基础设施成本出现显著、结构性的上涨,经过慎重评估,公司决定自 2026 年 3 月 1 日起,对续签及新签用户的全线产品与服务进行价格上浮调整。
涨价缘由是硬件成本提升,还是推理侧需求过于旺盛而导致供不应求?优刻得上述工作人员回复称:「两方面 (原因) 都有,主要是硬件成本上升,近期需求也在增加。当前的价格调整,也是行业从 『资源出租』 向 『能力服务』 转变的体现。」
不仅仅是国内厂商在涨价。1 月 23 日,全球云计算巨头亚马逊云科技宣布对其面向大模型训练的 EC2 机器学习容量块实施约 15% 的价格上调,这是 AWS(亚马逊云计算服务) 约 20 年来首次打破 「只降不涨」 的定价传统。机器学习容量块是 AWS 为应对高性能 GPU(图形处理器) 等稀缺计算资源供需失衡所推出的定制化服务模式,用户可提前预订指定型号的 GPU 实例,确保关键算力资源的稳定供给。
开源证券认为,AWS 作为亚马逊核心的公有云平台,此次涨价一方面再次确认了全球 AI 算力需求端的高景气度,另一方面从供给角度来看,AI 云产业链资源稀缺性或日益凸显。
Agent 拉动推理需求呈指数级上涨
对于公有云涨价,云服务商派欧云 (PPIO) 工作人员告诉每经记者,主要原因是推理需求的爆发式增长,其中 Agent(智能体) 的需求是主要增长因素;其次推理成本的上涨动力还来自服务质量的持续提高,高 SLA(服务等级协议)、低时延、长上下文、多模态等服务会产生支付溢价。
如果说红包大战带来的是用户人数增加从而带来算力需求提升,那么 Agent 的盛行,对推理算力需求的提升则更为庞大。
优刻得上述工作人员表示:「算力需求已从训练驱动的单一模式,转变为训练+推理双轮驱动且推理占比不断上升的新模式。Agent 的实时交互、多轮推理、工具调用与自主规划等能力,使得单次任务所需的推理次数呈指数级上升。」
PPIO 工作人员也对每经记者表示:「Agent 的广泛应用放大了 Token(词元) 的消耗,进而推高算力需求,一方面 Agent 推理上下文逐渐增加到 200K 以上,另一方面由于计算复杂度与上下文长度是平方关系,长上下文对算力的需求呈指数级增长。据我们估算,Agent 场景下单用户的 Token 消耗量是普通 Chat 的 10 倍至 50 倍,此外 Agent 对内存的需求也在持续增加,主要体现在 Agent 工具的数据记忆需求。」
值得注意的是,AI 推理不仅有云端,也有边缘侧、端侧设备。那么,即时性的要求是否会助推边缘侧、端侧 AI 推理需求增长?
对此,PPIO 工作人员表示:「至于边缘和端侧,我认为会增加部署,但会是 「云—边—端协同」 的混合架构:实时性强、隐私要求高、网络不稳定的场景会下沉到端和边缘,用小模型或本地推理保证响应;而需要最强通用能力、快速迭代的大模型能力,仍会集中在云端。关键不在把所有算力搬到端上,而在把任务链路切分得更合理。」
优刻得工作人员也表示:「我们会根据客户的需求来部署我们的产品和资源。根据不同业务场景对延迟、成本、合规性的差异化要求,灵活调度云端、边缘与端侧算力资源。」
封面图片来源:视觉中国
|每日经济新闻 nbdnews 原创文章|
未经许可禁止转载、摘编、复制及镜像等使用
文章转载自 每经网








