4 月 30 日,小米开源其首个推理大模型 Xiaomi MiMo,同时公开了小米大模型 Core 团队。该模型参数规模 7B,在数学推理和代码竞赛测评中超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 开源推理模型 QwQ-32B-Preview。此外,小米已启动大模型人才招聘,岗位包括 「大模型算法专家」 等,招聘详情显示,小米大模型的应用场景大多与自身业务或产品相关。
每经记者 杨卉 每经编辑 魏官红
曾说不做 OpenAI 类大模型的小米变了。
4 月 30 日,小米开源其首个推理大模型 Xiaomi MiMo,同时公开了一个此前未曾公开露面的团队:小米大模型 Core 团队。根据小米自己的说法,该模型只是团队的初步尝试。至于为何还是赶了 「晚班车」,小米方面称,2025 年虽看似是大模型逐梦的后半程,不过还是坚信 AGI(通用人工智能) 征途仍漫长。
参数方面,根据介绍,小米经强化学习训练形成的 MiMo-7B-RL 模型,在数学推理 (AIME 24-25) 和代码竞赛 (LiveCodeBench v5) 公开测评集上,用 7B 参数规模,得分超过了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 开源推理模型 QwQ-32B-Preview。
在这篇推介自家大模型的文章末尾,小米还默默公开了一个简历投递邮箱,为刚成立不久的团队 「招兵买马」。
《每日经济新闻》 记者注意到,在部分招聘软件上,小米已经上线了大量与大模型相关的招聘信息,如 「大模型算法专家」「大模型推理工程师」「大模型数据策略工程师」 等,其中公布的年薪最高可达 128 万元。此外,从招聘详情里也能看到小米给大模型落地找到的一些场景,如智能门锁、智能音箱、智能招聘、AI(人工智能) 面试、AI 会议助理、AI 办公助手、智能客服、智能审核等,大多与其自身现有业务或产品相关。
开源首个推理大模型 模型参数只有 7B
4 月 30 日,一个顶着黑底白字头像的微信公众号仅凭首条推送,就单枪匹马掀起了大模型产业的又一轮热议。仔细来看,这个头像传递的信息简单且直接,黑色背景内的一行白字说明了来处:Xiaomi MiMo;账户归属为北京小米移动软件有限公司,于 4 月 24 日将新注册公众号改名为 「Xiaomi MiMo」。
改名后不到一周,小米放出个 「大招」,直接官宣开源首个推理大模型。
根据推文内容,从参数来看,随着 DeepSeek-R1 引发业界强化学习 (RL) 共创潮,DeepSeek-R1-Distill-7B 和 Qwen2.5-32B 已成为广泛使用的强化学习起步模型。根据小米方面的说法,Xiaomi MiMo 是公司首个为推理而生的大模型,可联动预训练到后训练。在数学推理 (AIME 24-25) 和代码竞赛 (LiveCodeBench v5) 公开测评集上,MiMo 用 7B 的参数规模,超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。
图片来源:微信公众号 「Xiaomi MiMo」 推文截图
值得关注的是,小米这次开源的模型参数规模只有 7B,这就意味着可以在端侧设备上进行本地运行,主打一个经济高效。
至于推文中提到的预训练和后训练,据悉,MiMo 推理能力的提升是由预训练和后训练阶段中数据和算法等多层面的创新联合驱动。其中,预训练的核心是让模型见过更多推理模式,着重挖掘富推理语料,并合成约 200B tokens 推理数据。训练方面共进行了三阶段训练,逐步提升训练难度,总训练 25T tokens。
而后训练的核心则是高效稳定的强化学习算法和框架,其算法提出 Test Difficulty Driven Reward 来缓解困难算法问题中的奖励稀疏问题,并引入 Easy Data Re-Sampling 策略,以稳定 RL 训练。框架方面,设计了 Seamless Rollout 系统,使得 RL 训练加速 2.29 倍,验证可加速 1.96 倍。
开出百万元年薪招聘大模型算法专家 应用场景大多与自身业务相关
小米方面称,MiMo 是新成立不久的小米大模型 Core 团队的初步尝试。其实,严格来说,小米的大模型团队 Core 虽然是第一次带着作品亮相,但小米有大模型团队这件事并不是 「全网首秀」,小米集团早在 2023 年 4 月就组建了 AI 实验室大模型团队。
值得深究的是,大模型火热至今,已经从 「卷」 参数、「卷」 模型进入了 「卷」 落地应用的 「下半程」,小米此时赶这个 「晚班车」 意欲何为?
其实,小米曾公开表示不会做大模型。2023 年 5 月 24 日,小米集团披露了 2023 年第一季度业绩,小米集团总裁卢伟冰还在同日的电话财报会上谈到了彼时大厂开启的 「大模型竞赛」。那时,卢伟冰直言,小米集团不会做 OpenAI 类的大模型,但会积极拥抱 AI,将其与自身业务深度结合,提高智能化水平。
时隔两年,小米的态度为何变了?4 月 30 日下午,《每日经济新闻》 记者向小米集团方面咨询大模型团队的更多信息,截至发稿未获有效回复。不过,根据微信公众号 Xiaomi MiMo 的推文,小米显然也意识到了现在入场并不算早。至于入场原因,小米方面的说法是:「2025 年虽看似是大模型逐梦的后半程,但我们坚信 AGI 的征途仍漫长。」
值得关注的是,不管原因为何,小米集团在做大模型这件事上确实 「上心」 了。《每日经济新闻》 记者注意到,在某招聘平台上,北京小米移动软件有限公司,也就是 Xiaomi MiMo 公众号的账号归属方,已经开始了 「招兵买马」,放出大量与大模型相关的岗位招聘信息。
具体来看,在招岗位不少,有 「大模型算法」「大模型推理工程师」「大模型数据策略工程师」「大模型高性能优化工程师」「多模态大模型算法工程师」「端到端大模型算法工程师」「具身大模型算法工程师」 等,部分招聘信息中还写明了 「急招」。
图片来源:招聘软件截图
另外,从招聘详情中或可以窥见小米做大模型的方向,如直接表明 「文生图,图生图大模型算法」,再如 「多模态大模型算法工程师」 一职,岗位详情中提到,需要求职者进行大模型算法部署和小型化研究,还需负责大模型算法的落地应用,包括智能门锁、智能音箱等场景。「大模型算法」 一职的招聘详情中还提到,求职者需围绕智能招聘、AI 面试、AI 会议助理、AI 办公助手、智能客服、智能审核等应用场景,利用大语言模型和多模态大模型制定解决方案并进行迭代优化。
图片来源:招聘软件截图
从上述信息不难看出,小米做或者用大模型有两个倾向,一个是小型,便于落地端侧;还有就是应用场景大多与自身业务及产品线相关。至于薪资方面,小米招聘大模型相关岗位给出的薪资各不相同,其中部分岗位公开的最高年薪可达 128 万元。
封面图片来源:每日经济新闻 资料图
文章转载自 每经网