来源:
中国基金报
字节跳动在 AI 方面又有大动作。
6 月 11 日,字节跳动旗下火山引擎举办 Force 原动力大会。会上,字节跳动发布豆包大模型 1.6、视频生成模型 Seedance 1.0 pro 等重磅新模型。
字节跳动 CEO 梁汝波通过视频发言表示,AI 发展还处于早期,只是马拉松的前 500 米。在 AI 大模型带来的技术变革时代,字节跳动致力于成为优秀的创新科技公司。
豆包大模型 1.6 发布
打造三大模型矩阵
会上,火山引擎总裁谭待宣布,火山引擎正式发布豆包大模型 1.6 系列,进一步优化模型能力和服务成本。
据介绍,豆包 1.6 系列当前由三个模型组成,其中,doubao-seed-1.6 是全功能综合模型,支持 256K 长上下文、自适应思考 (自动判断是否开启深度推理);doubao-seed-1.6-thinking 强化深度推理,编码、数学、逻辑能力显著提升,支持复杂 Agent 构建;doubao-seed-1.6-flash 是极速版本,适用于实时交互场景 (如智能客服、语音助手)。
据介绍,豆包 1.6 系列模型支持多模态理解和图形界面操作,能够理解和处理真实世界问题。相比豆包 1.5 的多模态能力,图形界面操作能力让其进一步具备 「行动力」,如自动操作浏览器完成酒店预定,识别购物小票并整理成 Excel 表格等任务。
多项权威测评成绩显示,在复杂推理、竞赛级数学、多轮对话和指令遵循等测试集上,豆包 1.6-thinking 的表现已跻身全球前列。
除了多模态能力以外,大模型另一个振奋人心的领域是视频生成。会上,火山引擎发布最新的豆包视频生成模型 seedance 1.0 pro,支持无缝多镜头叙事、丝滑运镜,应用于电商广告、影视分镜、游戏剧情生成。
「根据第三方权威榜单,豆包视频生成模型在文生视频、图生视频两个维度都超越了业界诸多主流模型。」 谭待称。
豆包大模型成本降至 1/3
推动 Agent 规模化应用提速
在 AI Agent 快速发展的当下,规模化落地面临多重挑战,模型价格成为最大瓶颈。
谭待说,深度思考、多模态和工具调用等模型能力提升,是构建 Agent 的关键要素。同时,由于 Agent 每次执行任务都会消耗大量 tokens。只有模型使用成本降下来,才能推动 Agent 的规模化应用。
据介绍,通过技术和商业创新,豆包 1.6 创新 「区间定价」,深度思考、多模态能力与基础语言模型统一价格。在企业使用量最大的 0~32K 输入区间,豆包 1.6 的输入价格为 0.8 元/百万 tokens、输出 8 元/百万 tokens,综合成本只有豆包 1.5 深度思考模型或 DeepSeek-R1 的三分之一。
Seedance 1.0 pro 模型每千 tokens 仅 0.015 元,每生成一条 5 秒的 1080P 视频只需 3.67 元,为行业最低。
字节跳动技术副总裁洪定坤认为,随着模型能力的持续进步,AI 有机会成为调度者,通过调用不同的 Agent 和工具,让软件开发「all in one」,更大幅度地降低开发门槛,提升开发效率。
谭待认为,技术主体经历了三个时代变化,AI 时代会推动开发范式与技术架构全面升级。他说:「PC 时代主体是 Web,移动时代是 App,AI 时代则是 Agent。Agent 能够自主感知、规划和反思,完成复杂任务。」
字节跳动 CEO 梁汝波:
AI 发展还在马拉松的前 500 米
豆包大模型市场迄今表现出色,行业应用深度渗透。
据了解,豆包大模型日均 tokens 调用量从 2024 年 12 月的 4 万亿飙升至 2025 年 5 月的 16.4 万亿,年增长率超 300%,稳居中国公有云大模型服务调用量第一,占据 46.4% 的市场份额。
同时,企业级应用场景快速扩展,AI 搜索、编程、视觉理解等场景 tokens 消耗 5 个月增长 4.4 倍,其中,K12 在线教育增长 12 倍,智能巡检、视频检索等新场景突破日均百亿 tokens。
字节跳动 CEO 梁汝波通过视频发言表示,AI 发展还在很早期,只是马拉松的前 500 米。在 AI 大模型带来的技术变革时代,字节跳动也要对自己提出更高的要求,做一个优秀的科技公司还不够,得做优秀的创新科技公司,「前者是能够利用先进技术的公司,而后者能够探索和发明新技术,这是挑战非常大、有非常高天花板和想象力的事情」。
(中国基金报)
文章转载自东方财富