• 最新
  • 热门
  • 所有
  • 外汇
  • 24 小时
  • 期货
  • 基金
  • 贵金属
  • 股票
「小米系」暴涨!小米开源MiMo推理大模型

「小米系」 暴涨!小米开源 MiMo 推理大模型

2025 年 5 月 2 日
技术分析:黄金持续上涨,进入未知区间

技术分析:黄金持续上涨,进入未知区间

2025 年 9 月 10 日

《2025 年世界人才排名》 香港跃至亚洲第一

2025 年 9 月 10 日
苹果发布iPhone Air 这是其迄今为止最薄的机型

苹果发布 iPhone Air 这是其迄今为止最薄的机型

2025 年 9 月 10 日
广告
詹姆斯在人民日报撰文:希望能为中国篮球的发展贡献力量

詹姆斯在人民日报撰文:希望能为中国篮球的发展贡献力量

2025 年 9 月 10 日
美股三大指数震荡整理 阿里巴巴涨超3%

美股三大指数震荡整理 阿里巴巴涨超 3%

2025 年 9 月 10 日

7 月游戏市场整体景气度维持,游戏 ETF(159869) 打开低位布局通道

2025 年 9 月 10 日

以需求为牵引 多维推进期权深度应用

2025 年 9 月 10 日

数据打脸!美联储降息竟然是美股 「噩耗」?

2025 年 9 月 10 日

上半年由盈转亏,但二级市场表现亮眼:罗博特科战略转型泛半导体后再谋港股上市

2025 年 9 月 10 日

每日机构分析:9 月 9 日

2025 年 9 月 10 日
黄金到3700之前:多头该担心什么,空头还能等什么?

黄金到 3700 之前:多头该担心什么,空头还能等什么?

2025 年 9 月 10 日
以军袭击在卡塔尔的哈马斯高层 原油、黄金短线冲高

以军袭击在卡塔尔的哈马斯高层 原油、黄金短线冲高

2025 年 9 月 10 日
金桂财经
广告
2025 年 9 月 10 日 星期三
联系我们
合作建议
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
  • 登录& 注册
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 全球金融
  • 股市风云
  • 基金动态
  • 金财眼
  • 期货新闻
  • 期货研报
  • 外汇市场
  • 贵金属
  • 未来科技
没有结果
查看所有结果
金桂财经
没有结果
查看所有结果

「小米系」 暴涨!小米开源 MiMo 推理大模型

来自 金桂财经
2025 年 5 月 2 日
在 24 小时
0

来源:
证券时报网

  小米进军大模型,最擅长 「以小博大」。

  4 月 30 日,小米宣布开源首个为推理而生的大模型 Xiaomi MiMo。值得注意的是,其经过强化学习训练形成的 MiMo-7B-RL 模型,用仅仅 70 亿的参数,在多项权威基准测试中得分超过了 OpenAI 的闭源推理模型 o1-mini 和阿里通义千问 320 亿参数的 QwQ-32B-Preview,实现了 「以小博大」。

  受此消息影响,今日小米股价涨 5.37%,金山云和金山软件更是分别大涨 14.20% 和 7.07%。业内人士认为,小米作为国产头部的手机品牌厂商,此次开源的小参数规模模型展现了较强的性能,为 AI 在手机端侧的应用和运行提供了更坚实的模型基础。

  小米开源 MiMo 推理大模型

  4 月 30 日,小米宣布开源首个为推理而生的大模型 Xiaomi MiMo。据介绍,在数学推理 (AIME 24-25) 和代码竞赛 (LiveCodeBench v5) 公开测评集上,MiMo 仅用 7B 的参数规模,超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。

图片

  以 70 亿的小规模参数,实现了卓越的性能,MiMo 展现了小米 「以小博大」 的能力。据悉,这一成绩的取得,主要源于团队在预训练和后训练的数据和算法方面进行了多层组合创新努力。预训练是让模型领略更多的推理模型,而后训练则是打磨高效稳定的强化学习算法及框架。

  具体来看,MiMo 背后包含了许多技术细节,包括使用改进的组相对策略优化 (GRPO) 算法进行训练,移除 KL(Kullback-Leibler 散度) 损失、动态采样和增加上界裁剪等策略;提出测试难度驱动的奖励机制,将测试用例按难度分组,并根据难度分配奖励;采用易数据过滤和重采样策略,提高采样效率并稳定策略更新等等。

  小米大模型团队也已公开了 MiMo 的技术报告,展现了相关的技术细节。此外,MiMo-7B 全系列已开源,包括预训练模型 MiMo-7B-Base,监督微调模型 MiMo-7B-SFT 以及强化学习模型 MiMo-7B-RL 和 MiMo-7B-RL-Zero。

  小米大模型团队表示,MiMo 来自于全新成立不久的 「小米大模型 Core 团队」 的初步尝试。业内人士普遍认为,MiMo 的开源标志着 AI 发展从盲目追求参数规模转向注重算法效率和能力密度的理性发展期,通过技术创新,小模型同样可以实现高效率、大智慧,带来 「性价比革命」。

  小米全面发力 AI 大模型

  随着 MiMo 模型的开源,小米刚刚成立不久的小米大模型 Core 团队也终于浮出水面。小米创始人雷军曾在 2023 年表示,自 2016 年组建 AI 团队以来,到 2023 年 4 月第一时间成立专职大模型团队,经过多次扩展,小米 AI 团队相关人员规模已达 3000 多人,逐步建立了视觉、语音、声学、知识图谱、NLP、机器学习、多模态等 AI 技术能力。

  小米大力 「押宝」 大模型早在去年底便已有消息传出。DeepSeek-V3 爆火之后,背后的 AI「天才少女」 罗福莉引发了大众的关注,彼时就有媒体报道称,雷军以千万年薪招揽 DeepSeek 开源大模型 DeepSeek-V2 的关键开发者之一罗福莉,领导小米 AI 大模型团队。

  此外,小米也搭建了自己的 GPU 万卡集群,并持续提升算力储备,为大模型研发提供更充分的算力供给。今年 3 月,小米发布 2024 年报,明确 2025 年将投入 70 亿元以上资金用于 AI 研发,约占总研发经费的 1/4,重点聚焦 AI 基础设施、大模型开发及应用场景搭建。

  从招兵买马到 「补充弹药」,小米全面发力 AI 大模型,将 AI 视为下一个 「新战场」。值得注意的是,与其他大模型厂商追求高性能、大参数不同,小米大模型主攻轻量化、本地部署,也是业界第一个在手机芯片上跑通十亿参数规模大语言模型,验证了端侧小模型在部分目标场景可以取得媲美云端大模型效果。

  雷军曾表示,「小米拥有品类众多的设备,是全球规模领先的消费级物联网平台。设备多样,使用场景也各不相同,一个大模型难以兼顾。如果把一部分大模型能力下放到端侧,不仅能更好地保护用户隐私、而且有机会在本地实现千人千面的个性化定制。」 因此,在训练策略上,小米一直致力于减少参数的浪费,达到效率和效果的最佳均衡。

  同时,小米发力 AI,致力于将大模型与自身业务深度协同,围绕硬件生态做深场景,让 AI 真正服务于产品。目前,小米的 AI 技术能力已逐步接入手机、汽车、AIoT、机器人等业务板块,端侧赋能加速。业内人士认为,小米作为国产头部的手机品牌厂商,此次开源的小参数规模模型展现了较强的性能,为 AI 在手机端侧的应用和运行提供了更坚实的模型基础。

  中信建投研报表示,大模型能力不断迭代增长,但模型之间差异在缩小。这些技术需要在终端设备上应用落地,最终通过这些应用/终端实现商业价值的转化,从而形成一个从投资到变现的完整闭环。目前,Meta、字节、小米等巨头已经开始大力布局端侧 AI,抢夺 AI Agent 入口。除了手机、PC、眼镜、耳机外,潜在的端侧 AI 基数巨大,家电、机器人、智能车、教育办公设备、玩具等都受益于端侧 AI 的趋势,AI 嵌入将带来广泛的硬件升级。重点关注算力、存储、连接、电力等硬件环节。

(证券时报网)

文章转载自东方财富

YOU MAY ALSO LIKE

《2025 年世界人才排名》 香港跃至亚洲第一

美股三大指数震荡整理 阿里巴巴涨超 3%

Search

没有结果
查看所有结果

一周热门

技术分析:黄金持续上涨,进入未知区间

技术分析:黄金持续上涨,进入未知区间

2025 年 9 月 10 日

《2025 年世界人才排名》 香港跃至亚洲第一

2025 年 9 月 10 日
苹果发布iPhone Air 这是其迄今为止最薄的机型

苹果发布 iPhone Air 这是其迄今为止最薄的机型

2025 年 9 月 10 日
詹姆斯在人民日报撰文:希望能为中国篮球的发展贡献力量

詹姆斯在人民日报撰文:希望能为中国篮球的发展贡献力量

2025 年 9 月 10 日
美股三大指数震荡整理 阿里巴巴涨超3%

美股三大指数震荡整理 阿里巴巴涨超 3%

2025 年 9 月 10 日

7 月游戏市场整体景气度维持,游戏 ETF(159869) 打开低位布局通道

2025 年 9 月 10 日

以需求为牵引 多维推进期权深度应用

2025 年 9 月 10 日

数据打脸!美联储降息竟然是美股 「噩耗」?

2025 年 9 月 10 日

上半年由盈转亏,但二级市场表现亮眼:罗博特科战略转型泛半导体后再谋港股上市

2025 年 9 月 10 日

每日机构分析:9 月 9 日

2025 年 9 月 10 日
金桂财经

2025 年 9 月
一 二 三 四 五 六 日
1234567
891011121314
15161718192021
22232425262728
2930  
« 8 月    

近期动态

  • 技术分析:黄金持续上涨,进入未知区间
  • 《2025 年世界人才排名》 香港跃至亚洲第一
  • 苹果发布 iPhone Air 这是其迄今为止最薄的机型
  • 詹姆斯在人民日报撰文:希望能为中国篮球的发展贡献力量
  • 美股三大指数震荡整理 阿里巴巴涨超 3%
  • 7 月游戏市场整体景气度维持,游戏 ETF(159869) 打开低位布局通道
广告

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 关于本站
  • 联系我们
  • 隐私政策
没有结果
查看所有结果
  • 登录& 注册

Copyright © 2025 广州金桂广告传媒有限公司. 粤 ICP 备 2025390655 号

  • 登录
  • 注册
忘记密码?
Lost your password? Please enter your username or email address. You will receive a link to create a new password via email.
body::-webkit-scrollbar { width: 7px; } body::-webkit-scrollbar-track { border-radius: 10px; background: #f0f0f0; } body::-webkit-scrollbar-thumb { border-radius: 50px; background: #dfdbdb }