2025 年,AI 技术迎来爆发式增长,大语言模型的崛起,让企业对 AI 的商业落地充满期待。食品饮料行业如何真正用好 AI?哪些场景适合 AI 落地?AI 落地有哪些难点?企业如何通过 AI 创造独特的价值?
钛媒体企业数字化 IP《数字价值观察室》 在 2025 年聚焦 AI 落地场景,通过真实数据、真实案例、真实对话,拆解 AI 落地的 「真问题」 与 「真解法」。
《数字价值观察室·AI 落地场景观察》 第二期,钛媒体集团联合创始人& 联席 CEO 刘湘明对话蒙牛集团相关负责人,基于蒙牛新发布的 《食品饮料行业 AI 转型白皮书》(点击下载完整版白皮书),深入探讨了食品饮料行业的 AI 应用实践。
AI 应用正在从 「可玩」 走向 「可用」,成为企业发展的核心驱动力。而越来越多的开源模型,就像是把 「近乎免费的武器」 摆在了企业的桌面上,企业要么用 AI 重塑竞争力,要么就可能成为 「AI 时代的恐龙」。
蒙牛自 2022 年底便开始布局生成式 AI。此次发布的白皮书,正是基于两年多的实践经验总结,展示了 AI 在食品饮料行业的典型应用场景,筛选出了五大领域、十大应用场景,并按 「研、产、供、销」 加 「通用」 归类。白皮书中的案例筛选标准包括本土化、落地性、领先性和可复制性,所有案例均已在企业内部成功运行。
在大模型应用方面,企业面临着如 「自研大模型」 还是 「使用第三方方案」 的技术路径选择。大模型应用主要有三种常见方式。第一类是传统软件的AI 化,例如钉钉、飞书等办公软件都已进行了 AI 升级;第二类是垂直大模型,如金融、医疗等特定行业,特别是那些拥有大量行业数据的企业,通过训练行业大模型实现更精准的智能化应用;第三类是 「大模型+Agent+知识库」 模式,即以大模型为基础,结合知识库搭建企业级 Agent。通过强化智能体能力,打造出属于企业自己的 「数字员工」 队伍。因此,不同企业的 AI 应用路径需要根据数据量、成本收益和具体应用需求进行综合考量,以确保技术投入的最大化回报。
AI 对食品饮料行业的影响无疑将是深远的。以蒙牛为例,部分业务流程已经实现了 AI 自主,比如蒙牛宁夏 「灯塔工厂」,订单拆分、排产调度等环节都已由 AI 自动执行。未来或许会出现 AI 原生品牌,完全由 AI 运行,不过可能会分阶段实现:先从辅助决策,到人机赛跑,最终走向 AI 自主决策。但在人类仍然是主导者、监督者。
AI 正在深刻改变食品饮料行业的竞争格局, 但 AI 已不再是可选项,而是企业发展的必然选择。
附上本期直播时间轴,帮你快速跳转感兴趣的部分:
00:58 AI 从 「战略选择」 变为 「生存刚需」
09:54 十大核心应用场景,AI 助力全链路升级
13:58 自研 or 第三方?大模型应用的三种主流路径
18:43 智能体 (Agent) 如何驱动企业 AI 应用?
46:40 AI 原生品牌时代即将到来?
【以下为对话实录,经钛媒体 APP 编辑】
对话人:
Q:钛媒体集团联合创始人& 联席 CEO 刘湘明
A:蒙牛集团相关负责人
AI 从 「战略选择」 变为 「生存刚需」
Q:各位观众大家好!欢迎来到数字价值观察室!今天,我们非常荣幸地邀请到了蒙牛集团相关负责人来聊聊 AI 在食品饮料行业的落地。DeepSeek 今年非常火,千行百业都在接入,你觉得这种火爆给食品饮料行业带来什么样的启示?
A:从技术的角度来看,第一,AI 技术现在还没有成熟和定型,新的技术架构可能会继续颠覆大家对 AI 能力的认知。DeepSeek 本身也是一个技术型的创新,它的能力的提升,和大家以往的认知不同,不是靠堆算力,堆数据。它在技术上有很多探索,比如像 MoE(混合专家模型),蒸馏技术的应用,在更低成本下实现了更高的能力。
第二,大多数模型其实用的还是 Transformer 架构,这个架构其实也不是唯一的技术路径。我们也能看到去挑战 Transformer 注意力机制的一些论文,并提出了一些新的构想。所以,AI 能力现在肯定还没到天花板。但是其实地板已经出现了。从千行百业都在接入,包括原先做大模型的大厂也都接入了,都是从侧面印证了现在的 AI 有一些实用价值的能力了。
此外,我们在企业端从商业的视角来看这个事情,两年前 AI 的应用可能还算是一种战略选择,企业可以积极一点去主动的拥抱 AI,去做一些探索;也可以选择做个 「等等党」,看看这个技术是真对产业有影响、有意义,还是说像一些技术只是在某些行业,某些场景里有一些比较实质的改变,而对于大多数的企业来说,可能只是一个技术浪潮。
但是现在,我觉得形势变了,AI 从原来的战略选择变成了生存刚需。这个其实也跟越来越多的开源模型有关,开源之后,相当于把近乎免费的武器放到了桌面上,如果你不捡起来用,你的竞争对手就可能拿起来对付你。从以前还能再等等、再看看,变成了近乎 「非上不可」,不然就可能变成 「AI 时代的恐龙」。因此,食品饮料行业的 AI 转型升级也在加速。
Q:前几天蒙牛发布了一份食品饮料行业的 AI 转型白皮书,你们为什么要做这么一份白皮书?
A:蒙牛在这波 AI 浪潮中是属于引入 AIGC 技术的先行派,已经实际尝试了大概两年时间。2022 年 GPT-3.5 发布的时候,我们做了技术研判,觉得这是能深刻改变整个行业的技术,就开始组建团队,进行不同的试点。历经两年多时间,有很多的探索,正好也是赶上春节期间推理模型再次刷屏了,所以我们想借着这个时间点把落地经验做个发布。拿一些真正已经落地的案例,让更多的行业企业去看到,这一波的 AI 技术在产业里已经能实现什么样的作用。
十大应用场景,AI 助力全链路升级
Q:白皮书里边也筛选了不少非常有趣的场景,你们筛选的标准是什么?
A:食品饮料本身是一个产业跨度很大的行业,第一产业 (泛指农业)、第二产业 (主要指加工制造产业)、第三产业 (现代服务业或商业) 都有,比如说种草、养殖、产出牛奶、做加工 (初加工、深加工),包装之后进商贸流通,产业场景特别的丰富。我们当时在做场景和案例筛选的时候,基本上也是按照企业 「研、产、供、销」 的价值链,再加上一些通用领域做得一个系统性的梳理。
这本白皮书的案例部分,最终是五个域、十大场景、二十多个具体的案例。筛选的考量主要有几点:
第一,选择本土化的案例。我们也能看到很多国外的企业在用 AIGC 去做一些尝试和探索,但是国外跟国内的产业基础和面临的市场情况、政策情况其实都不太一样,所以是选了本土化的案例。
第二,我们的案例都是已经落地了、跑通了的,有运行数据经验的,在这个场景能发挥实际作用的。
第三,在案例的技术路径方面,我们选了以这一波的 AIGC 技术为主的案例。虽然说在传统的整个产业里,决策式 AI、小模型应用的也很多。紧跟技术发展趋势,我们特别整理了这些前沿应用的典型案例,给大家做做分享。
最后,就是复制性,既然是希望能让行业的企业去更多地参考借鉴,这些案例选的还是有一定的普适性、通用性,能让更多企业从通用的场景里产生思考。
Q:因为开源对行业推动非常大,其实你们也是把自己过往在 AI 落地里边的很多的经验做了一次开源,可以这么理解吗?
A:也是致敬开源的精神。经验分享和技术开源类似,会有积极的外部效应,大家都在为推动整个行业发展去做一些事情。蒙牛是乳业国家队,不仅是在数智化领域,在其他方面,我们也一直在做有行业担当的事情,做一些底层技术的研发,主导建立一些行业标准的制定等等。
自研 or 第三方?大模型应用的三种主流路径
Q:现在企业还是面临一个决策,到底是做自研的大模型,还是选择直接用成熟的大模型或第三方案?你觉得做这个决策需要考虑的核心因素是什么?企业到底应该怎么去选择?
A:我们当年也做过这样的探索,也训练出了营养健康领域模型 MENGNIU.GPT。现在看来,大模型的 AI 能力应用大概有三种比较常见的方式。
第一类,传统软件本身就在 AI 化。比如像钉钉,飞书,腾讯会议,你不用去刻意地去用它,它的 AI 功能就加上来了。
第二类,自研的垂类大模型。我们当时在做垂类大模型的时候,通用大模型的基础能力没有现在这么好,我们是把蒙牛和一些合作伙伴手上的数据资源,共同地去把这个模型在营养健康领域方面做了进一步的调优。
今天,情况可能又不太一样了,因为底层大模型的能力有了极大的提升,而且现在公域数据已经都被训练完了。现在是不是还要自研,去做个垂类的大模型,以下几点要考虑清楚:第一,是不是有自己足够多的还没有被训练进去的数据?这是一个很关键的事情。第二,跟场景需求有关,可能有一些场景因为安全或者政策性的要求,使得没有办法去调用这种通用大模型的能力。
但是无论是什么原因,整个的训练成本还是相对比较高的,如果说当前的场景需求通过现在大的通用大模型基本上可以满足,那么再去训练一个自己的大模型,投入产出比不一定像以前那么高了。
从百模大战到现在,真正还在持续更新模型的可能只有五分之一、十分之一,慢慢的会集中到几个厂商。我看到的可能就只有比如像金融、医疗这种既有特别垂的数据,成本收益也还好,同时也有一些政策性上的限制行业,去做比较垂的模型的情况会多一些。
第三类,现在相对主流、试错成本低、工具链也比较成熟的一个方式,就是大模型+Agent+知识库的方式。白皮书里收录的一些案例,不少是基于这个技术路径去打造的。业界说今年是 Agent 元年,大模型这种简单的聊天方式肯定不是其真正应用到产业里的方式,还是需要一个相对复杂一点的架构,能贴合企业的具体情况发挥作用。所以我们做了很多 「大模型+Agent+知识库」 的 Agent 出来。
Q:白皮书里边其实用了很多的 Agent,比如像养殖顾问、萃智牛博、营销魔盒,这些 Agent 背后使用的技术有什么区别吗?比如说接智谱或者接其他,区别大不大?
A:智能体在业界也没有一个特别统一的定义,但大家公认的 Agent 是作为一个载体,比如说有长期记忆的功能,能去调取不同工具的 API,能自主去规划一些事情。所以说每个智能体背后的运作逻辑是相似的,都是通过重现业务的工作流:每一步要做什么、每一步的关键的点是什么、怎么去判断、输出什么样的结果。起重要作用的就是 Prompt(提示词),通过提示词智能体一步一步地去把这个事情操作下来。
虽然说运行原理是这样,但它接入不同的模型,结果肯定也是不一样的。首先是模型可以分为两种,一种是推理模型,比如 R1,另外一种是对话模型 V3。推理模型有思维链,它会根据提问做一些背景情况的补充、意图的识别,把更多的信息给到它后面的推理。在具体的表现上,你会发现简单地问一下 R1,它就能说出很多结构化的东西,清楚全面,所以显得能力很强。
但在企业具体的场景里,不光是需要这种结构化的思维,智能体运作的逻辑就是复现实际工作流,工作流本身是有逻辑的,有的情况是不需要 R1 自己去推理,有时候反而是因为自己想多了没有达到预期的结果。R1 和 V3 这两个模型比,V3 就显得更老实,遵从性更好。用什么模型需要考虑匹配相应的场景,如果说需要创造性,R1 的结果可能就会更好,但是说如果工作的整个流程是很标准化,很固定的,像 V3 这样的对话模型执行得会更标准和稳定。
第二,模型本身的底层能力也不一样。现在大家也是感受到不同模型的能力差异,出现很多 「缝合怪」 式的应用方式。之前我听了一个叫 「DeepGemini」 的产品,它先让推理模型去做推理,把推理内容输入给对话模型去生成最终结果,结果发现比两者单独用更好。不同的模型还是有一定的适用场景的问题。
第三,成本不同,个人应用的时候这件事情不太明显,因为大量的国内个人端目前都是免费的。但是到企业用的时候,成本就会是一个问题了。我们现在的 AI 中台上面有个功能,它会根据创建智能体的基本场景,自动推荐一个模型。比如说写个文本,可能它会推荐 V3,不仅能胜任工作,而且 V3 比 R1 便宜不少。根据用户需求自动匹配能胜任的模型,而不是说随便一个简单任务就都调一个能力很强但很贵的模型。这可能是在企业方面多一层的考虑。
智能体如何驱动企业 AI 应用?
Q:刚才你谈到了通用智能体,我看 OpenAI 也推出了开源的多智能体工作流的编排框架,叫 Agent SDK,还有支持网络搜索、文件搜索、计算机控制这些内置工具的 Responses API,这些是不是意味着整个通用型的智能体会越来越普遍?
A:我觉得大模型的能力会走向通用化,但是智能体反而会走向专业化。OpenAI 做的智能体搭建的工具包,从时间上来看,推出的不能算早,比如国内有 Coze,还有一些开源的都很好用。OpenAI 推出这个工具包,其实还是说业界对 Agent 是实现大模型能力的一个认可。
第二,这个工具包里搭配了很多调用其他不同的 API 的功能,Agent 能调用的 API 越多,它能实现的功能就越多,那么它的功能其实也就越强大。蒙牛之前有业务中台,其实就是把系统里的原子能力沉淀出来,变成可拼接的积木,等到其他新系统的需求来的时候,它就可以通过搭积木的方式更快地去形成一个应用。我们现在做的就是把这些历史上积累出来的原子能力,这些 API 做 AI 友好化的改造,也是为了让 AI 中台上的企业大脑可以去调度企业内部原先就有的这些 API,实现企业级的能力。
我认为智能体也会走向专业化,会变成一个原子能力级的智能体。当有一个复杂的工作的时候,可能有一个 Super Agent,相当于 Agent 的小组长,它会根据任务自己去调组员,调完组员之后形成一个 Agent 之间的协作。
白皮书里也收录了一个类似的案例,叫营销魔盒。营销魔盒里面有三个主要的 Agent,第一个 Agent 是热点追踪 Agent,把市场上的热点先搜集到。第二个 Agent 是内容生成的 Agent,会把搜索来的热点跟企业的产品自动地找结合点,形成创意。比如,前两周女神节,它就会根据我们内部一些女性向的产品产生一些创意,并进一步生成营销方面的内容。第三个 Agent 是 SEO(搜索引擎优化),同样一篇内容在不同的平台上去发的时候,因为每个平台的搜索规则和流量规则是不完全一样的,这个 SEO 的 Agent 就负责把文稿打造成个性化的、针对不同平台的文稿。
这三个 Agent 协作起来之后,就相当于把整个业务链条上的所有的职能都串联起来了,就可以通过 Agent 的协作把整个链条都覆盖。但是其实我也可以把 SEO 这个 Agent 剥离出来单独用,其他方式创作的内容,也可以用 SEO Agent 来优化。智能体以后可能就变成一个 Agent 的团队在那里,根据用户的不同需求,它自己组队去完成工作。
Q:白皮书里面有没有一些共性的应用值得大家借鉴?
A:除了研产供销这四个域之外,还有一个通用域。通用域里有一个案例叫 「AI 融入流程」。无论企业规模如何,它都有一些既有的系统,而且但凡先上系统的,通常是企业里最为关键的核心的业务,对这些系统如何去进行 AI 赋能?可以通过这种外挂型的 AI 助手来帮助现有的业务流程做赋能和提效。
传统的业务流程基本可以分成两类:执行、决策。
执行类的比较常见,比如填表单,整个的填写过程其实是一个最基本的输入过程,后面的决策、审批,都是以这些信息为基础的。比如有一个包装破损物品要退货,一线员工可能就会写 「破损需要退换」 那么几个字,然后单子就提上来了。这个时候,审批的人说这个信息不全,就打回去了,这么一来一回时效就差了。
我们现在做的这个功能就包括辅助填写,比如包装破损,它根据之前提报的表单大概知道几种情况,生成一个半模板化的东西,用户只需要稍微改几个字,这个信息就全面精准了,再提交上去,提高了审批通过率。
第二类就是跟决策相关。有特别简单的决策,比如请假,报销,都是 RPA(机器人流程自动化) 规则写好,单子扫描上去费用就报销了。还有一些可能就涉及这种复杂性的、非标的,一个审批上来挂了好多个附件,决策者看的时候就比较费劲了。
现在大语言模型来了,有几点明显变化。第一个就是提炼能力,先提炼一段附件上的内容,做一个相对的精炼,能把这个事情来龙去脉,更简洁明了地说清楚。第二,提供决策建议,比如,仓库调拨的场景,有一个从 A 仓库调一批货去 B 仓库的申请,以前这个场景,看完审批申请,可能要看一下两个仓的库存情况,然后为什么要把 A 仓的货调去 B 仓?甚至是不在同一个系统里,决策者要跨系统地去掌握信息,再结合他的经验去做判断。现在把所需的库存数据自动调出来,AI 结合基本判断逻辑,先给一个带推理过程的判断建议,是否同意这个调拨:「比如说 A 仓还有 500,计划调 50 到 B 仓,因为 B 仓只剩 30 了,按照 B 仓的正常的销售节奏,可能 30 用不了两天就没有货了」。这些所有的内容通过一个外挂的方式提供给决策者,决策者可以参考,也不用跨系统地去看各种数据,提升决策的效率和质量。这是我们现在在做的,把 AI能力全面融入现有的业务流程里,于是也就有了 「见习期的数字员工」。「数字员工」 能独立承担某些岗位中的特定任务;还能连接不同系统,调用工具自动干活;在固定领域能自己规划步骤、执行任务,不再需要人工操作或者参与。因此,在业务流程中,可以清晰的描述出数字员工所承担的工作任务 (有明确的任务目标、所需输入、工作标准,以及执行成果等),可以精确的统计出数字员工所执行的工作量 (比如几分钟就从上百份简历中,筛选出了合适的 10 个候选人),可以看到整条流程上有多少百分比的任务被多个数字员工赋能了。
Q:现在模型也开源了,经验分享了,包括大家都在选择第三方的方案,企业怎么做出差异化,怎么建立自己的优势?
A:差异化本质上是需要进行创新,行业和企业的 know-how 跟技术方案去结合是最重要的。白皮书里每个案例都是有一个结构化输出的,从场景到解决方案,再到运行的实际效果,最后是经验总结。但直接抄作业的可能性基本不大,因为每个企业流程不同,基础也不同,要解决具体的问题也不一样。我认为是这个白皮书的案例最大的价值点是通过经验总结带来启发,帮助读者企业思考。
现在的 AI 技术也没有定型、能力没到顶,创新是一个向内求和向外求的事情:向内求,就是怎么把自己的业务场景吃透。向外求,就是要知道 AI 的能力的边界在哪。既不要把它想象得无所不能、无所不知,也不能置之不理。最终,要靠企业自身来把真正的场景挖掘出来。
AI 原生品牌时代即将到来?
Q:你觉得未来食品饮料行业有没有可能诞生出从研发、生产、物流到营销的全流程 AI 决策的 AI 原生品牌?
A:我觉得有一部分可能已经实现了。比如蒙牛在宁夏的灯塔工厂,订单过来之后,它会自己把订单拆分,拆分到不同的产线,自己去做排产排程,这个过程就已经实现 AI 自动决策了。
至于会不会所有的流程都由 AI 决策,最关键的问题其实是决策权的问题——人类能不能把这个决策权给到 AI?这可能也涉及一些 AI 伦理,比如说 AI 能不能承担这样的责任?现在一个比较大的问题是:AI 的决策是黑箱的。
长远看,我觉得这件事情是非常有可能发生的,但在此之前,它可能会去分步骤地去发生。就像现在很多人类制定好规则,AI 来校对事实跟规则是否相符,它其实是在做决策里的执行,这可能是第一阶段。第二阶段,AI 可能会真正的跟人来个 A/B Test,PK 一下到底谁的决策质量好。到了第三阶段,可能 AI 的能力已经达到或者超越人力的水平,AI 可以真正自主做决策,人类可能在旁边做监督,避免问题和挽回局面。
以上为 《数字价值观察室·AI 落地场景观察》 第二期直播的部分内容,接下来,我们也将持续关注 AI 将如何重塑食品饮料行业产业发展。
(本文首发于钛媒体 App)