7 月 26 日,WAIC 2025 在上海开幕,后摩智能展出了其 M50 系列产品,该芯片专为 AI 大模型推理设计,面向 AI PC、智能终端等场景。后摩智能 CEO 吴强表示,未来大模型将向推理和端边智能迁移,后摩智能通过存算一体技术,推动 AI 大模型在端边侧实现离线可用、数据保密。吴强还透露,公司已启动下一代 DRAM-PIM 技术研发,旨在提升 AI 算力普及。
每经记者|陈婷 每经实习编辑|余婷婷
7 月 26 日,「2025 世界人工智能大会暨人工智能全球治理高级别会议」(WAIC 2025) 在上海开幕,国产算力的进展是各方关注的核心议题之一。
在后摩智能展台,《每日经济新闻》 记者看到,后摩智能 M50 系列产品首次亮相,后摩智能 M50 芯片与力谋®BX50 计算盒子、力擎 LQ50 Duo M.2 卡等旗下核心产品一同位于展台的核心位置。
作为主打端边大模型和存算一体的芯片企业,后摩智能这次带来的 M50 芯片专为大模型推理设计,主要面向 AI PC(人工智能个人电脑)、智能终端等场景。
「未来大模型有两个重要发展趋势:一是大模型的重心逐渐从训练向推理迁移。二是从云端智能逐渐向边端或者端边智能迁移。」7 月 25 日,后摩智能 CEO(首席执行官) 吴强对包括 《每日经济新闻》 记者在内的媒体表示。他认为,未来的计算格局有可能是端 (终端设备)、边 (边缘计算)、云 (云计算) 的混合体,90% 的数据处理可能会在端和边。
WAIC 2025 后摩智能展台 图片来源:每经记者 陈婷 摄
公开资料显示,后摩智能创立于 2020 年,创立早期定位为基于存算一体技术的大算力 AI(人工智能) 芯片研发企业。创始人吴强拥有美国普林斯顿大学博士学位,曾任地平线 CTO(首席技术官),早年曾任职于 AMD、Facebook。
近年来,国内涌现了不少 「存算一体」 企业,作为该方向的早期探索者,后摩智能建立起护城河了吗?又是什么促使其在两年前转向专注端边大模型 AI 芯片?
「不应该拼价格,拼的是性价比」
吴强将 M50 芯片视为后摩智能过去两年交出的一份答卷。
据介绍,M50 芯片实现了 160TOPS INT8、100TFLOPS bFP16 的物理算力,搭配最大 48GB 内存与 153.6 GB/s 的超高带宽,典型功耗仅 10W,相当于手机快充的功率,能让 PC、智能语音设备、机器人等智能移动终端高效运行 1.5B 到 70B 参数的本地大模型,实现了 「高算力、低功耗、即插即用」。
除了 M50 芯片,后摩智能此次发布的产品矩阵形成了覆盖端侧到边缘的多元算力方案。力擎 LQ50 Duo M.2 卡以口香糖大小的标准 M.2 规格,为 AI PC、陪伴机器人等移动终端提供 「即插即用」 的端侧 AI 能力。
在吴强看来,存算一体技术是后摩智能的立身之本。
根据光大证券的相关研报,存算一体技术是指将计算逻辑直接嵌入到存储单元中,使数据在存储器内完成部分或全部计算任务,从而减少数据在存储器与处理器之间的传输。这种技术可以显著降低数据传输延迟和功耗,提高系统的整体性能。
2023 年初,吴强在接受采访时曾表示,国产替代的企业可以对标海外的某类产品,但绝不能用同样的技术路径进行照搬,如英伟达、AMD 等国际巨头的研发、工程、供应链能力远超过初创企业,硬碰硬难以取得成功,创业公司需要另辟蹊径,以一种差异化的技术路线来应对和巨头们之间的竞争。
据了解,当前,后摩智能通过存算一体技术与大模型的深度融合,推动 AI 大模型在端边侧实现 「离线可用、数据留痕不外露」。
作为存算一体方向的早期奔跑者,后摩智能已经明确了当下的发展路径。
吴强称,M50 芯片的发布是后摩智能现阶段迈出的重要的一步,后面会推出更多的芯片去解决端边大模型的算力和功耗问题以及带宽问题。
「长期来说,后摩希望定位在端边 AI 计算。」 吴强表示,后摩智能希望做出能效比更好的端边芯片,用更好的能效比,解决客户的一些问题。
在他看来,M50 的发布只是一个开始,「我们的目标是让大模型算力像电力一样随处可得、随取随用。」
有观点认为,2025 年或是端侧 AI 的爆发元年。在这一赛道,后摩智能的市场竞争力是什么?
「我的观点是不应该拼价格,我们拼的是性价比。」 吴强表示,功耗敏感、成本敏感,是端边的特色。他提到,在端边,只要对客户创造价值,就有人愿意买单。
「端边大模型蕴藏着很大的机会」
值得一提的是,2023 年下半年,后摩智能的目标市场发生过转向。
2023 年 5 月,后摩智能推出了国内首款存算一体智驾芯片后摩鸿途 H30,其 AI 物理算力、功耗等多项数据一度惊艳了市场,为快速发展的智能汽车产业带来了全新的解决方案。
当时,后摩智能选择了切入智能驾驶领域。后摩智能方面在当时表示,智能驾驶是一个具象化的场景,存算一体芯片从该场景切入也有一些鲜明的特点与优势。
后摩智能创始人兼 CEO 吴强博士 图片来源:每经记者 陈婷 摄
然而,吴强很快就发现了这一目标市场存在的问题。
「2023 年下半年,整个自动驾驶赛道非常卷,格局逐渐稳定,给新入局的机会越来越少。」 吴强表示,为了体现存算一体的优势,后摩智能的一代芯片算力做得很大,忽略了当时市场的需求。
吴强解释称,算力大就意味着成本高,可 2023 年下半年都在讲价格、讲低成本。在此大背景下,(当时推出的芯片) 算力太超前、太冗余了。
后摩智能很快就看到了新的机会。
据悉,2023 年,后摩智能就得出了一个结论,即 「端边的大模型蕴藏着很大的机会」。
「无论是商业还是个人,端边的 AI 都有可能成为更懂你的 AI。因为它本身是有很多天生的优势,尽管刚刚开始,大模型刚刚开始,端边刚刚开始,但是它本身有更好的实时响应,更低的使用成本,更安全的数据隐私,以及更好的个人的用户体验。未来这会成为一个趋势。」 吴强说。
得出这一结论之后,2024 年初,后摩智能快速把第一代芯片调整了一版,推出了 M30,针对大模型做了一些调整和优化。
随着 M50 系列产品的推出,后摩智能已经确认了新的目标市场。据了解,本次推出的 M50 产品可广泛应用于消费终端、智能办公、智能工业等多元领域,且均能在离线状态下实现全流程本地处理,从源头杜绝数据联网传输风险。
吴强还向记者披露了当下后摩智能的意向客户,包括联想的下一代 AI PC 产品、讯飞听见的下一代智能语音设备以及中国移动的全新一代的 5G+AI 边缘计算设备等。
就日渐火热的具身智能给芯片行业带来的机会,吴强认为,机器人包括具身智能机器人 (特指陪伴机器人),更像是十年前的智能驾驶,是一个新兴的垂直赛道,格局还未定,「大家还有机会」。
不过,他也提到,由于具身智能的发展还处于比较早期,「专门为它做一个芯片养活自己是不可能的,它还有很长的过程。但我看好它的未来」。
据了解,面向未来,后摩智能已启动下一代 DRAM-PIM 技术研发,通过将计算单元直接嵌入 DRAM 阵列,使计算与存储的协同更加紧密高效。该技术将突破 1TB/s 片内带宽,能效较现有水平再提升三倍,推动百亿参数大模型在终端设备实现普及,让更强大的 AI 算力能够融入 PC、平板等日常设备。
文章转载自 每经网



