如何打破「玩具」标签与同质化困局？刘庆峰：四大关键核心破解 AI 落地难题

作者：
秦盛

　　「AI 红利的兑现，需要攻克自主可控、软硬一体、行业纵深和个性化四大关键核心。」

　　11 月 6 日，在第八届世界声博会暨 2025 科大讯飞全球 1024 开发者节上，科大讯飞董事长刘庆峰指出，AI 应更「懂人」，在技术飞速演进、能力持续增强的背景下，需让每个人都能借助 AI 发挥独特价值，推动世界从少数顶尖 AI 的同质化「内卷」，转向多元化、个性化的 AI 赋能。

　　刘庆峰以目前最热的人形机器人与 AI 智能体（Agent）为例称，首届机器人运动会被广泛吐槽为「玩具级」，正是因为机器人尚不能实现与人的自然交流，也未能将 AI 能力真正融入实际生活与工业场景。智能体同样面临挑战，尽管部分已实现 API（应用接口）联动，但许多仍缺乏规范的账号体系、接口打通方案与行业深度理解，整体成熟度还有待提升。

　　11 月 6 日，刘庆峰在开发者节介绍最新技术情况。

　　基于全国产算力平台，科大讯飞在长思维链强化学习训练效率与 MoE 模型全链路训练效率方面实现突破，深度推理训练效率从 30% 提升至 84% 以上，MoE（混合专家）模型全链路训练效率大幅提升。

　　在当天的发布会上，科大讯飞正式推出深度推理大模型——讯飞星火 X1.5。该模型采用 MoE 架构，总参数量 293B，激活参数 30B，推理效率较上一代 X1 实现翻倍，在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力等六大维度对标国际主流模型，数学能力持续领先，支持超 130 种语言，整体性能达到 GPT-5 的 95% 以上。

　　刘庆峰强调，科大讯飞始终以「自主可控对标国际顶尖、行业模型做到全球第一、多元模型成为世界第二选择」为目标。他表示：「确保不出现代差，就可以在最迫切需要的行业中实现超越」。

　　科大讯飞还首发了非自回归语音大模型架构，通过并行一次性输出整个文本序列，推理效率得到大幅提升。相比同尺寸自回归模型，效果相对提升 16%，推理成本下降 520%。

　　发布会还重点首发了两大核心技术。一是个性化记忆能力，星火 X1.5 通过构建用户个性化记忆库，实现对用户长期画像、近期反馈、短期对话的综合理解。同时，基于星火语音大模型，仅需一句录音即可复刻任意音色，并用一条指令创造任意风格的声音。

　　软硬一体方面，科大讯飞当天也发布了多个解决方案。如通过「AI+麦克风阵列技术」，高噪环境下识别准确率达 95.08%，识别效果超 iPhone 17 Pro 的智能办公本；借助「AI+扬声器阵列技术」与自研硬件算法，让车内音效媲美百万豪车的智能座舱音响方案 iFLYSOUND。据悉，iFLYSOUND 已在 19 家车企量产落地，出货超 100 万台。

　　此前，科大讯飞就曾在投资者互动平台表示，过去几年在受限的有限算力资源条件下，公司关于星火大模型训练和推理成本效率的持续优化做了大量投入。和直接使用英伟达卡上开展的各种工程优化不同，科大讯飞选择了更难的全国产算力路线。自 2023 年 5 月起，科大讯飞联合华为先后攻克了万卡高速互联组网、计算通信隐藏、训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题，将通用大模型、类 OpenAI o1 的深度推理模型等的训练效率对标英伟达 A100 均从最初的 30%-50% 优化达到了 85%-95% 以上。随着国产算力在底层能力上进一步提升，讯飞星火的训练成本还有较大的下降空间。

　　根据科大讯飞三季报显示，公司第三季度实现营业收入 60.78 亿元，同比增长 10.02%；归母净利润 1.72 亿元，同比增长 202.40%；扣非净利润 2623.89 万元，同比增长 76.50%；经营性现金流净额 8.95 亿元，同比增长 25.19%，实现了季度净利润与现金流的转正。

　　刘庆峰强调，人工智能是硬科技，是强技术竞争，但更应是赋能每个人更好融入世界、共创温暖未来的力量。

　　截至 11 月 6 日收盘，科大讯飞股价报收 53.6 元/股，涨 1.57%。

（澎湃新闻）

文章转载自东方财富