7月26日,在WAIC2025期间,荣耀发布MagicGUI大模型并开源。该模型参数规模为70亿,是荣耀“阿尔法战略”重要成果。相较于传统语音助手,MagicGUI更接近于“数字助理”,可跨应用协同完成任务。荣耀MagicOS副总裁孙建发表示,模型报告已登陆GitHub平台,相关测试数据将于近期上线。
每经记者|王晶 每经编辑|董兴生
AI(人工智能)时代的手机,不应满足于依靠大模型的能力仅实现一些诸如翻译、文档处理、你问我答之类的简单功能,AI的“智慧”和手机的便捷特性理应有更广阔的想象空间。
7月26日,在“2025世界人工智能大会暨人工智能全球治理高级别会议”(WAIC2025)期间,荣耀发布MagicGUI大模型并开源。该模型也是其“阿尔法战略”的重要成果,参数规模为70亿。相较于传统语音助手多数还停留在机械式对话的初级阶段,MagicGUI的角色更接近于一位“数字助理”,它不仅可以理解复杂需求,更能跨应用协同完成任务。以打车场景为例,荣耀智能体YOYO可在滴滴、高德等出行App中实现打开应用、选择地址、确认车型并下单等多步流程。这背后是AI智能体(Agent)多模态感知、UI理解和自动执行规划等能力在终端的加速落地。
事实上,自2023年OpenAI引爆大模型热潮以来,主流手机厂商已逐渐形成共识:语音助手的“鸡肋时代”将走向终结,AI助手不再是“聊天机器人”或被动响应,而是具备感知、推理、决策、操作能力的“轻量级智能体”。在这一趋势下,vivo、OPPO、小米等厂商也已在2024年密集推出具备类似复杂任务执行能力的智能体方案。但如今,基于MagicGUI大模型,荣耀的YOYO已经从单智能体任务执行进化为多智能体协同。
从单智能体任务执行到多智能体协同
回望2011年,苹果首次在iPhone上引入语音助手Siri,为全球用户打开了人机语音交互的大门。但十余年过去,Siri的功能更新有限,人们多数时候只会用Siri来设置闹钟或播放歌曲,而不是将其看作一个真正的数字助手。
在苹果2025年全球开发者大会(WWDC)上,苹果没有展示任何关于Siri的新功能,这意味着AI版Siri继续“跳票”。甚至直到现在,国行iPhone 15Pro系列/iPhone 16系列的用户仍无法体验苹果的AI功能。
即便用户提出诸如“嗨,Siri,帮我在美团App上点一杯咖啡”这类请求,Siri至今也只能打开App,无法进一步解析页面并完成后续动作。
反观安卓阵营,近年来,在AI助手实用性和系统集成度方面的进展普遍优于苹果。从荣耀的“YOYO”、vivo的“蓝心小V”到小米的“超级小爱”,纷纷从传统语音助手进化为“任务型智能体”,能够完成点咖啡、订餐厅、发红包、拨打微信电话等任务。
其中,基于MagicGUI大模型,荣耀智能体还实现了从单智能体任务执行到多智能体协同的升级。比如“一语打车”“一语PPT”,YOYO智能体可同时调度多个专项智能体(如设计、排版、支付模块),完成操作流程。借助MagicGUI大模型赋予的感知、推理、规划、反思、执行任务的全链路能力,YOYO能够像人类助理般拆解复杂任务、调度跨应用资源等。而单智能体在处理复杂任务时会显露出局限性,比如缺乏长期规划能力,通常处理单一、特定的任务等。
从App主导到Agent主导
移动手机时代,用户与设备交互的主体是一个个App,用户通过点击、输入,在各个应用之间来回切换完成任务,而在AI驱动的终端智能体框架中,主导权正由App转向Agent,即“能理解屏幕、规划步骤、自动执行”的AI助手。
这种变化背后,是各大厂商对GUI Agent(图形用户界面智能体)技术的持续投入。作为一种多模态视觉模型驱动的系统,GUI Agent可以通过观察手机界面(如截图或UI结构)感知手机状态,并生成相应的动作(如点击、输入、滑动等)来实现任务自动化。荣耀的MagicGUI大模型,即是该技术方向在终端的一次系统落地。
然而,手机GUI智能体在实际部署场景中常常面临重大挑战。比如,移动应用和用户界面的多样性创造了许多长尾场景,截至2025年仅Google Play上就有168万个应用,现有智能体在长尾场景中难以有效执行任务;智能手机上的各类App的内容变动频繁,操作不确定性强。
为此,荣耀方面介绍,其算法团队为MagicGUI模型设计了一个两阶段的训练范式,包括继续预训练(CPT)与强化微调(RFT),前者通过大规模注入GUI相关知识,提升模型的屏幕感知与定位能力;后者引入了空间增强的复合奖励函数与DF-GRPO算法,通过强化学习激发模型知识表达,进一步提升模型的效果和泛化能力。
经过训练的MagicGUI大模型使得YOYO能根据屏幕视觉信息边思考边行动,依据页面反馈推理下一步操作,更智能高效。如果遇到用户指令有误、操作无法完成等突发情况,它也能主动停止。
开源方面,荣耀MagicOS副总裁孙建发表示:“目前荣耀MagicGUI大模型报告已登陆GitHub平台(软件项目托管平台),模型与相关测试数据将于近期上线相关开源平台。”
文章转载自 每经网