作者:
秦盛
「AI 红利的兑现,需要攻克自主可控、软硬一体、行业纵深和个性化四大关键核心。」
11 月 6 日,在第八届世界声博会暨 2025 科大讯飞全球 1024 开发者节上,科大讯飞董事长刘庆峰指出,AI 应更 「懂人」,在技术飞速演进、能力持续增强的背景下,需让每个人都能借助 AI 发挥独特价值,推动世界从少数顶尖 AI 的同质化 「内卷」,转向多元化、个性化的 AI 赋能。
刘庆峰以目前最热的人形机器人与 AI 智能体(Agent) 为例称,首届机器人运动会被广泛吐槽为 「玩具级」,正是因为机器人尚不能实现与人的自然交流,也未能将 AI 能力真正融入实际生活与工业场景。智能体同样面临挑战,尽管部分已实现 API(应用接口) 联动,但许多仍缺乏规范的账号体系、接口打通方案与行业深度理解,整体成熟度还有待提升。

11 月 6 日,刘庆峰在开发者节介绍最新技术情况。
基于全国产算力平台,科大讯飞在长思维链强化学习训练效率与 MoE 模型全链路训练效率方面实现突破,深度推理训练效率从 30% 提升至 84% 以上,MoE(混合专家) 模型全链路训练效率大幅提升。
在当天的发布会上,科大讯飞正式推出深度推理大模型——讯飞星火 X1.5。该模型采用 MoE 架构,总参数量 293B,激活参数 30B,推理效率较上一代 X1 实现翻倍,在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力等六大维度对标国际主流模型,数学能力持续领先,支持超 130 种语言,整体性能达到 GPT-5 的 95% 以上。
刘庆峰强调,科大讯飞始终以 「自主可控对标国际顶尖、行业模型做到全球第一、多元模型成为世界第二选择」 为目标。他表示:「确保不出现代差,就可以在最迫切需要的行业中实现超越」。
科大讯飞还首发了非自回归语音大模型架构,通过并行一次性输出整个文本序列,推理效率得到大幅提升。相比同尺寸自回归模型,效果相对提升 16%,推理成本下降 520%。
发布会还重点首发了两大核心技术。一是个性化记忆能力,星火 X1.5 通过构建用户个性化记忆库,实现对用户长期画像、近期反馈、短期对话的综合理解。同时,基于星火语音大模型,仅需一句录音即可复刻任意音色,并用一条指令创造任意风格的声音。
软硬一体方面,科大讯飞当天也发布了多个解决方案。如通过 「AI+麦克风阵列技术」,高噪环境下识别准确率达 95.08%,识别效果超 iPhone 17 Pro 的智能办公本;借助 「AI+扬声器阵列技术」 与自研硬件算法,让车内音效媲美百万豪车的智能座舱音响方案 iFLYSOUND。据悉,iFLYSOUND 已在 19 家车企量产落地,出货超 100 万台。
此前,科大讯飞就曾在投资者互动平台表示,过去几年在受限的有限算力资源条件下,公司关于星火大模型训练和推理成本效率的持续优化做了大量投入。和直接使用英伟达卡上开展的各种工程优化不同,科大讯飞选择了更难的全国产算力路线。自 2023 年 5 月起,科大讯飞联合华为先后攻克了万卡高速互联组网、计算通信隐藏、训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题,将通用大模型、类 OpenAI o1 的深度推理模型等的训练效率对标英伟达 A100 均从最初的 30%-50% 优化达到了 85%-95% 以上。随着国产算力在底层能力上进一步提升,讯飞星火的训练成本还有较大的下降空间。
根据科大讯飞三季报显示,公司第三季度实现营业收入 60.78 亿元,同比增长 10.02%;归母净利润 1.72 亿元,同比增长 202.40%;扣非净利润 2623.89 万元,同比增长 76.50%;经营性现金流净额 8.95 亿元,同比增长 25.19%,实现了季度净利润与现金流的转正。
刘庆峰强调,人工智能是硬科技,是强技术竞争,但更应是赋能每个人更好融入世界、共创温暖未来的力量。
截至 11 月 6 日收盘,科大讯飞股价报收 53.6 元/股,涨 1.57%。

(澎湃新闻)
文章转载自东方财富



