[ccpw id="5"]

2025 年 8 月 1 日 上午 2:54
Home股票直击WAIC 2025丨对话安永陈剑光:衡量AI Agent “好用”的关键指标需兼顾技术效能与业务价值
spot_imgspot_img

直击WAIC 2025丨对话安永陈剑光:衡量AI Agent “好用”的关键指标需兼顾技术效能与业务价值

-

每经记者|张梓桐    每经编辑|裴健如    

OpenAI发布具备自主思考能力的ChatGPT智能体;零一万物发布企业级Agent智能体“万仔”⋯⋯一时之间,AI Agent(智能体)正从概念加速落地,国内外科技巨头纷纷布局。

7月28日,在2025世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2025)上,安永大中华区发布AI Agent产品——安永智能问答3.0。安永大中华区人工智能与数据咨询服务联席主管合伙人陈剑光在接受《每日经济新闻》(以下简称NBD)记者采访时表示,衡量AI Agent“好用”的关键指标需兼顾技术效能与业务价值。

图片来源:企业供图

陈剑光强调,AI Agent是否“好用”,技术上需关注准确性、响应速度等指标,业务上则需关注效率提升、成本优化、风控增强等实际价值,需体现对业务目标的支撑度。

除此之外,不同行业的Agent需求差异显著。

金融业聚焦风控合规,如投资组合合规助手、实时交易监控;零售业侧重供应链优化与精准营销,如消费者行为分析推荐Agent;制造业则深耕设备维护与生产优化,典型如预测性维护Agent、质量检测Agent。不过,各行业在人事、行政等职能部门存在共性需求,核心是提升运营效率。

以下为对话实录:

Agent应用两大核心痛点:系统集成障碍与垂直领域适配度不足

NBD:目前企业在落地Agent应用时,最常遇到的痛点是什么?从您的实践经验来看,这些痛点背后的核心原因是什么?

陈剑光:目前,企业在部署Agent应用时,普遍面临的两大核心痛点是系统集成障碍与垂直领域适配度不足。

Agent与企业现有的核心业务系统(如ERP、CRM、财务系统等)的协同困难是一个高频挑战。实践中经常看到,由于接口协议不一致、数据格式不兼容等问题,Agent难以顺畅地与这些系统进行数据交换和指令执行,从而造成任务中断、效率低下。比如,一个负责费用报销的财务Agent,可能因无法正确解析不同格式的票据信息而导致流程停滞。

在面对特定行业的专业场景时,通用Agent模型常常显得“力不从心”,关键在于缺乏深度融入行业的知识库和数据来做支撑。例如,在金融风控领域,模型需要整合瞬息万变的监管规则和市场数据;在医疗诊断领域,则需要模型具备理解并融合影像和文本病历的能力。通用模型在这些高度专业化的环境中,精度往往难以达到业务要求。

这些痛点的背后,核心原因在于双重壁垒。一是技术整合壁垒。打通异构系统的“最后一公里”,需要解决复杂的技术接口、数据映射和流程衔接问题,工程实施复杂度高。二是领域知识与数据治理壁垒。构建真正有效的垂直领域Agent,不仅需要引入深厚的行业专业知识,还需要高质量、结构化的领域数据进行持续训练与调优。然而,高质量数据的获取、清洗、标注及其所涉及的治理成本,构成了显著的障碍。这不仅是技术门槛,更是知识工程和数据资产管理的系统性挑战。

NBD:不同行业(比如金融、零售、制造业)的企业在使用Agent时,需求和应用场景会有明显差异吗?能否举例说说典型行业的特色应用?

陈剑光:行业间的差异化需求非常显著,主要体现在核心业务流程的差异和数据属性的专业性要求上。

例如,金融业高度关注风险控制和合规管理,典型Agent的应用场景如面向客户经理的投资组合分析助手,提供合规建议,或者类似于提供自动化的实时交易监控Agent,用于识别交易异常模式。

零售业的核心痛点围绕供应链优化、库存管理、精准营销与客户体验提升。典型场景如分析消费者行为数据的个性化推荐Agent;优化物流路线的动态规划Agent等。

制造业的应用场景可能更关于设备维护管理、生产流程优化与质量控制等。典型应用包括预测性维护Agent,通过分析设备传感器数据提前预警故障;生产排程优化Agent,实时调整产线资源分配;整合视觉识别技术的质量检测Agent,自动化识别产品缺陷等。

行业差异决定了Agent的核心使命:解决各自领域最关键的效率瓶颈或风险点。另外,各个企业也都存在一些共性场景,例如对于人事、行政、法务、通用IT支持等职能部门,需求通常集中于提升内部运营效率,如自动化查询政策信息、标准化审批流程、提供IT支持等。这类Agent应用追求的核心价值是流程自动化与执行效率提升。

业务价值指标是证明Agent投入产出比的核心

NBD:企业Agent的“智能化”程度往往是关注焦点,您认为衡量一个企业Agent“好用”的关键指标有哪些?

陈剑光:衡量企业Agent是否真正好用,需要从技术效能与业务价值双维度综合评估,考量其对业务目标的支撑度。

技术效能指标是Agent基础能力的量化体现,依据其具体目标设定,包括准确性、鲁棒性、响应速度、吞吐量等。以一个面向内部的客户服务查询Agent为例,技术指标包括用户咨询的意图识别准确度、后台信息查询的响应时间、调用客服系统接口的成功率等。

业务价值指标则是证明Agent投入产出比的核心,体现实际落地效果,包括效率提升(是否缩短业务流程时长、节省人力操作时长)、成本优化(优化运营成本、识别潜在客户)、风控提升(降低合规风险/操作风险)、质量提升(提升产品/服务质量)等。

在技术指标满足的基础上,能清晰量化其对实际业务的影响,是Agent价值的体现。

NBD:随着大模型技术的发展,企业Agent在功能迭代上有哪些新趋势?比如,是否会更注重多模态交互或自主决策能力?

陈剑光:确实,企业Agent的能力边界正在被大模型技术不断拓宽。Agent正从单一的文本交互,向融合视觉、听觉等多模态信号的方向发展,这使得Agent能处理和应对更复杂的企业场景。例如,通过图像识别解析扫描文档、表单、仪表盘截图等非结构化信息;结合语音识别与合成技术,构建更自然、可提供多感官交互体验的数字人(虚拟客服、培训助手);在工业质检中,整合视觉识别实现对产品缺陷或生产线异常的自动化检测等。

随着大模型理解、推理和规划能力的提升,Agent在预设规则和安全边界内的自主决策能力正在增强,能处理更复杂的规则组合,逐步从纯“执行者”向具有一定分析能力的“辅助决策者”角色演进。通过学习和掌握更广泛、更复杂的工具调用能力,将更深度地嵌入现有业务流程,自动触发并协调后端系统的多项操作,形成更强的端到端自动化链条。

除了“多模态”“多功能”“多协作”,即由多个具备不同技能的Agent组成“团队”,通过明确的任务分配和协作机制,共同完成更复杂的、需要多步推理或跨系统协作的任务链,提升整体解决问题的能力上限。

NBD:对于还未尝试Agent应用的中小企业,您认为它们可以从哪些低成本、易落地的场景入手,逐步感受其价值?

陈剑光:对于初次尝试的企业,我们建议采取“小步快跑”策略,可以先从轻量场景切入,即需求明确、技术轻量、能快速体现价值的“试点场景”。例如,文档摘要与信息检索,可以通过智能信息助手,针对企业内部政策/知识库问答,包括HR福利查询、IT常见问题解答;轻度的业务流程自动化,包括简单表单数据的自动化审核(如检查必填项、格式合规)、标准化通知的定时发送等;以及协同增强工具,包括编程助手提升、智能文档翻译等。

对中小企业而言,初期应当利用成熟的外部服务API(应用程序编程接口)来快速扩展Agent的功能,或选择提供Agent能力的SaaS(软件运营服务)产品或按需付费的模型服务(如大模型服务商的Agent平台),也可基于低代码/零代码平台构建属于自己的Agent应用,以降低硬件投入和初始维护成本。

通过这些试点,企业能低成本验证技术价值,积累运营经验,培养团队信心,为后续更复杂、深度的应用打下基础。

最重要的是深刻理解——Agent的核心价值,绝非简单地“替代人力”,而是通过承担规则性、重复性的流程执行任务,释放员工的时间和精力,使其能够投入到更富创造力的工作、更复杂的判断决策和更高价值的创新活动中。其终极目标是实现“人机协同、人智增强”,推动组织效能升级。

封面图片来源:每日经济新闻 资料图

文章转载自 每经网

最新动态

推荐阅读

spot_img