【文章来源:techweb】
【TechWeb】 最近 AI 圈的一大看点,莫过于蚂蚁灵波和谷歌的 「开源接力」。
先是蚂蚁灵波密集出手,从 1 月 27 日开始,四天连续开源四大核心模型,其中可对标谷歌 Genie 3 的开源世界模型 LingBot-World 一经发布,谷歌火速跟进,于 1 月 30 日面向特定用户开放世界模型体验平台 Project Genie。
这场前后脚的动作,瞬间引爆全球 AI 社区,相关话题全天占据 X 热门榜单首位。蚂蚁牵头开源世界模型为啥能引起这么大的反响,让老外都直呼 「Amazing」?
蚂蚁撕开缺口 海外 AI 圈炸锅
在海外社交平台,蚂蚁 LingBot-World 的 Demo 一放出,即吸引到不少海外网友疯狂打 call,直呼这个来自中国的模型太震撼了。
从画面呈现来看,LingBot-World 视觉效果已经可以做到与谷歌推出的 Genie 3 不相上下,但时间维度明显更长。
据了解,LingBot-World 能做到近 10 分钟连续无损生成,物体特征、场景逻辑始终保持一致,就像真实世界一样稳定。
而且 LingBot-World 生成的视频不仅能看,还可以深度参与其中。你可以通过键盘或鼠标操控角色与相机视角,画面随指令即时反馈。
你还能以文本指令触发天气、风格等环境变化,且在镜头最长移动 60 秒返回后,目标物体仍能保持物体结构和外观的一致性。

整个过程,端到端交互延迟控制在 1 秒以内,也就是说,你操作后,世界立刻会有反应。生成帧率约 16 FPS,画面流畅不卡顿。
值得一提的是,该模型具备 Zero-shot 泛化能力,只需要输入一张真实照片 (如城市街景) 或游戏截图,就可以生成可交互的视频流,无需再针对单一场景进行额外训练或数据采集,从而解决具身智能训练成本高、泛化能力弱的行业核心痛点。
长期以来,全球高端 AI 模型多走闭源路线,谷歌、OpenAI 等巨头牢牢把控核心技术,形成行业壁垒。如果学术界和初创公司想训练一个高质量的世界模型,门槛是极高的。
而蚂蚁 LingBot-World 的发布,让大家看到,中国也有 SOTA 级的世界模型,而且还是开源的。
德国头部财经网站 AdHocNews 评价称,「蚂蚁集团发布了名为 LingBot-World 的高质量机器人 AI 模拟环境。这家中国科技公司完善了一套完整的开源工具包,用于物理 AI 系统的开发。这也是在全球机器人领域主导权争夺战中的一项战略性举措。」

还有行业专家直言,「这对整个行业都是变革,此前这类训练环境通常是专有的,成本昂贵。现在,每位开发者都能接触到工业标准技术。」
有意思的是,LingBot-World 在 X 上发布后,谷歌就宣布开源体验平台 Project Genie,部分用户可以试用 Genie 3。
两大巨头先后官宣,世界模型开源开放的窗口被打开,海外社区反响热烈,相关话题全天占据 X 热门榜单首位,Reddit 多个 AI 子社区将其列为 Top 1 热帖。
四大开源模型齐亮相 具身智能 「全能工具箱」 有了
蚂蚁灵波在开源世界模型 LingBot-World 之外,还相继开源了高精度空间感知模型 LingBot-Depth、具身大模型 LingBot-VLA 和具身世界模型 LingBot-VA。这四大开源模型并非孤立存在,而是层层递进,构建起从 「感知」 到 「行动」 再到 「认知」 的完整技术链条,实现从虚拟预训练到真实世界部署的无缝衔接,解决具身智能 「训练成本高、泛化难、执行偏差」 等核心挑战。
其中,LingBot-Depth 相当于机器人的 「眼睛」,主攻透明反光物抓取这一行业痛点,能帮助机器人更精准地识别物体三维空间关系。蚂蚁还与奥比中光深度合作,后者计划基于 LinBot-Depth 打造了新一代深度相机。
LingBot-VLA 相当于机器人的 「通用大脑」,基于 20000+小时真实机器人操作数据训练而成,能同时适配 9 种主流双臂机器人构型,实现 「一脑多机」,从而缓解具身智能模型落地面临的泛化性问题。这也是蚂蚁开源的第一款具身智能基座模型。
LingBot-World 相当于机器人的 「数字训练场」,为具身智能、自动驾驶、游戏开发提供低成本的虚拟训练环境。
LingBot-VA 则将大规模视频生成模型与机器人控制深度融合,让机器人能够像人一样 「边推演、边行动」,打通世界模型到物理执行的最后一公里。真机评测中,LingBot-VA 在多项高难操作任务上性能超越业界标杆 Pi0.5。

写在最后:
蚂蚁灵波四大模型的全链条开源,对其自身、行业乃至全球格局来说,都有着不小的影响。
此前,高端 AI 模型的研发和使用门槛极高,中小企业和初创公司因资金、算力不足,难以涉足前沿领域。蚂蚁的开源举措,相当于免费向全球开发者开放工业级技术工具包,让开发者无需从零造轮子,仅凭消费级硬件就能部署和微调模型。
特别是世界模型,于全球格局而言,蚂蚁率先撕开了高性能世界模型闭源缺口,展现了国产 AI 的技术实力,谷歌同期调整策略,世界模型赛道从封闭竞争转向开放协同。
开源普惠,不仅激活了中小企业的创新活力,更让 AI 技术从少数巨头专属走向全民共享,加速技术迭代速度。也让蚂蚁在具身智能、世界模型赛道确立了先发优势。
这不仅是一次技术的突围,更标志着在具身智能的下半场,中国科技公司正试图用 「开源定义标准」 的新范式,重写全球 AI 创新的游戏规则。2026,好戏正在上演。
【文章来源:techweb】
【TechWeb】 最近 AI 圈的一大看点,莫过于蚂蚁灵波和谷歌的 「开源接力」。
先是蚂蚁灵波密集出手,从 1 月 27 日开始,四天连续开源四大核心模型,其中可对标谷歌 Genie 3 的开源世界模型 LingBot-World 一经发布,谷歌火速跟进,于 1 月 30 日面向特定用户开放世界模型体验平台 Project Genie。
这场前后脚的动作,瞬间引爆全球 AI 社区,相关话题全天占据 X 热门榜单首位。蚂蚁牵头开源世界模型为啥能引起这么大的反响,让老外都直呼 「Amazing」?
蚂蚁撕开缺口 海外 AI 圈炸锅
在海外社交平台,蚂蚁 LingBot-World 的 Demo 一放出,即吸引到不少海外网友疯狂打 call,直呼这个来自中国的模型太震撼了。
从画面呈现来看,LingBot-World 视觉效果已经可以做到与谷歌推出的 Genie 3 不相上下,但时间维度明显更长。
据了解,LingBot-World 能做到近 10 分钟连续无损生成,物体特征、场景逻辑始终保持一致,就像真实世界一样稳定。
而且 LingBot-World 生成的视频不仅能看,还可以深度参与其中。你可以通过键盘或鼠标操控角色与相机视角,画面随指令即时反馈。
你还能以文本指令触发天气、风格等环境变化,且在镜头最长移动 60 秒返回后,目标物体仍能保持物体结构和外观的一致性。

整个过程,端到端交互延迟控制在 1 秒以内,也就是说,你操作后,世界立刻会有反应。生成帧率约 16 FPS,画面流畅不卡顿。
值得一提的是,该模型具备 Zero-shot 泛化能力,只需要输入一张真实照片 (如城市街景) 或游戏截图,就可以生成可交互的视频流,无需再针对单一场景进行额外训练或数据采集,从而解决具身智能训练成本高、泛化能力弱的行业核心痛点。
长期以来,全球高端 AI 模型多走闭源路线,谷歌、OpenAI 等巨头牢牢把控核心技术,形成行业壁垒。如果学术界和初创公司想训练一个高质量的世界模型,门槛是极高的。
而蚂蚁 LingBot-World 的发布,让大家看到,中国也有 SOTA 级的世界模型,而且还是开源的。
德国头部财经网站 AdHocNews 评价称,「蚂蚁集团发布了名为 LingBot-World 的高质量机器人 AI 模拟环境。这家中国科技公司完善了一套完整的开源工具包,用于物理 AI 系统的开发。这也是在全球机器人领域主导权争夺战中的一项战略性举措。」

还有行业专家直言,「这对整个行业都是变革,此前这类训练环境通常是专有的,成本昂贵。现在,每位开发者都能接触到工业标准技术。」
有意思的是,LingBot-World 在 X 上发布后,谷歌就宣布开源体验平台 Project Genie,部分用户可以试用 Genie 3。
两大巨头先后官宣,世界模型开源开放的窗口被打开,海外社区反响热烈,相关话题全天占据 X 热门榜单首位,Reddit 多个 AI 子社区将其列为 Top 1 热帖。
四大开源模型齐亮相 具身智能 「全能工具箱」 有了
蚂蚁灵波在开源世界模型 LingBot-World 之外,还相继开源了高精度空间感知模型 LingBot-Depth、具身大模型 LingBot-VLA 和具身世界模型 LingBot-VA。这四大开源模型并非孤立存在,而是层层递进,构建起从 「感知」 到 「行动」 再到 「认知」 的完整技术链条,实现从虚拟预训练到真实世界部署的无缝衔接,解决具身智能 「训练成本高、泛化难、执行偏差」 等核心挑战。
其中,LingBot-Depth 相当于机器人的 「眼睛」,主攻透明反光物抓取这一行业痛点,能帮助机器人更精准地识别物体三维空间关系。蚂蚁还与奥比中光深度合作,后者计划基于 LinBot-Depth 打造了新一代深度相机。
LingBot-VLA 相当于机器人的 「通用大脑」,基于 20000+小时真实机器人操作数据训练而成,能同时适配 9 种主流双臂机器人构型,实现 「一脑多机」,从而缓解具身智能模型落地面临的泛化性问题。这也是蚂蚁开源的第一款具身智能基座模型。
LingBot-World 相当于机器人的 「数字训练场」,为具身智能、自动驾驶、游戏开发提供低成本的虚拟训练环境。
LingBot-VA 则将大规模视频生成模型与机器人控制深度融合,让机器人能够像人一样 「边推演、边行动」,打通世界模型到物理执行的最后一公里。真机评测中,LingBot-VA 在多项高难操作任务上性能超越业界标杆 Pi0.5。

写在最后:
蚂蚁灵波四大模型的全链条开源,对其自身、行业乃至全球格局来说,都有着不小的影响。
此前,高端 AI 模型的研发和使用门槛极高,中小企业和初创公司因资金、算力不足,难以涉足前沿领域。蚂蚁的开源举措,相当于免费向全球开发者开放工业级技术工具包,让开发者无需从零造轮子,仅凭消费级硬件就能部署和微调模型。
特别是世界模型,于全球格局而言,蚂蚁率先撕开了高性能世界模型闭源缺口,展现了国产 AI 的技术实力,谷歌同期调整策略,世界模型赛道从封闭竞争转向开放协同。
开源普惠,不仅激活了中小企业的创新活力,更让 AI 技术从少数巨头专属走向全民共享,加速技术迭代速度。也让蚂蚁在具身智能、世界模型赛道确立了先发优势。
这不仅是一次技术的突围,更标志着在具身智能的下半场,中国科技公司正试图用 「开源定义标准」 的新范式,重写全球 AI 创新的游戏规则。2026,好戏正在上演。
【文章来源:techweb】
【TechWeb】 最近 AI 圈的一大看点,莫过于蚂蚁灵波和谷歌的 「开源接力」。
先是蚂蚁灵波密集出手,从 1 月 27 日开始,四天连续开源四大核心模型,其中可对标谷歌 Genie 3 的开源世界模型 LingBot-World 一经发布,谷歌火速跟进,于 1 月 30 日面向特定用户开放世界模型体验平台 Project Genie。
这场前后脚的动作,瞬间引爆全球 AI 社区,相关话题全天占据 X 热门榜单首位。蚂蚁牵头开源世界模型为啥能引起这么大的反响,让老外都直呼 「Amazing」?
蚂蚁撕开缺口 海外 AI 圈炸锅
在海外社交平台,蚂蚁 LingBot-World 的 Demo 一放出,即吸引到不少海外网友疯狂打 call,直呼这个来自中国的模型太震撼了。
从画面呈现来看,LingBot-World 视觉效果已经可以做到与谷歌推出的 Genie 3 不相上下,但时间维度明显更长。
据了解,LingBot-World 能做到近 10 分钟连续无损生成,物体特征、场景逻辑始终保持一致,就像真实世界一样稳定。
而且 LingBot-World 生成的视频不仅能看,还可以深度参与其中。你可以通过键盘或鼠标操控角色与相机视角,画面随指令即时反馈。
你还能以文本指令触发天气、风格等环境变化,且在镜头最长移动 60 秒返回后,目标物体仍能保持物体结构和外观的一致性。

整个过程,端到端交互延迟控制在 1 秒以内,也就是说,你操作后,世界立刻会有反应。生成帧率约 16 FPS,画面流畅不卡顿。
值得一提的是,该模型具备 Zero-shot 泛化能力,只需要输入一张真实照片 (如城市街景) 或游戏截图,就可以生成可交互的视频流,无需再针对单一场景进行额外训练或数据采集,从而解决具身智能训练成本高、泛化能力弱的行业核心痛点。
长期以来,全球高端 AI 模型多走闭源路线,谷歌、OpenAI 等巨头牢牢把控核心技术,形成行业壁垒。如果学术界和初创公司想训练一个高质量的世界模型,门槛是极高的。
而蚂蚁 LingBot-World 的发布,让大家看到,中国也有 SOTA 级的世界模型,而且还是开源的。
德国头部财经网站 AdHocNews 评价称,「蚂蚁集团发布了名为 LingBot-World 的高质量机器人 AI 模拟环境。这家中国科技公司完善了一套完整的开源工具包,用于物理 AI 系统的开发。这也是在全球机器人领域主导权争夺战中的一项战略性举措。」

还有行业专家直言,「这对整个行业都是变革,此前这类训练环境通常是专有的,成本昂贵。现在,每位开发者都能接触到工业标准技术。」
有意思的是,LingBot-World 在 X 上发布后,谷歌就宣布开源体验平台 Project Genie,部分用户可以试用 Genie 3。
两大巨头先后官宣,世界模型开源开放的窗口被打开,海外社区反响热烈,相关话题全天占据 X 热门榜单首位,Reddit 多个 AI 子社区将其列为 Top 1 热帖。
四大开源模型齐亮相 具身智能 「全能工具箱」 有了
蚂蚁灵波在开源世界模型 LingBot-World 之外,还相继开源了高精度空间感知模型 LingBot-Depth、具身大模型 LingBot-VLA 和具身世界模型 LingBot-VA。这四大开源模型并非孤立存在,而是层层递进,构建起从 「感知」 到 「行动」 再到 「认知」 的完整技术链条,实现从虚拟预训练到真实世界部署的无缝衔接,解决具身智能 「训练成本高、泛化难、执行偏差」 等核心挑战。
其中,LingBot-Depth 相当于机器人的 「眼睛」,主攻透明反光物抓取这一行业痛点,能帮助机器人更精准地识别物体三维空间关系。蚂蚁还与奥比中光深度合作,后者计划基于 LinBot-Depth 打造了新一代深度相机。
LingBot-VLA 相当于机器人的 「通用大脑」,基于 20000+小时真实机器人操作数据训练而成,能同时适配 9 种主流双臂机器人构型,实现 「一脑多机」,从而缓解具身智能模型落地面临的泛化性问题。这也是蚂蚁开源的第一款具身智能基座模型。
LingBot-World 相当于机器人的 「数字训练场」,为具身智能、自动驾驶、游戏开发提供低成本的虚拟训练环境。
LingBot-VA 则将大规模视频生成模型与机器人控制深度融合,让机器人能够像人一样 「边推演、边行动」,打通世界模型到物理执行的最后一公里。真机评测中,LingBot-VA 在多项高难操作任务上性能超越业界标杆 Pi0.5。

写在最后:
蚂蚁灵波四大模型的全链条开源,对其自身、行业乃至全球格局来说,都有着不小的影响。
此前,高端 AI 模型的研发和使用门槛极高,中小企业和初创公司因资金、算力不足,难以涉足前沿领域。蚂蚁的开源举措,相当于免费向全球开发者开放工业级技术工具包,让开发者无需从零造轮子,仅凭消费级硬件就能部署和微调模型。
特别是世界模型,于全球格局而言,蚂蚁率先撕开了高性能世界模型闭源缺口,展现了国产 AI 的技术实力,谷歌同期调整策略,世界模型赛道从封闭竞争转向开放协同。
开源普惠,不仅激活了中小企业的创新活力,更让 AI 技术从少数巨头专属走向全民共享,加速技术迭代速度。也让蚂蚁在具身智能、世界模型赛道确立了先发优势。
这不仅是一次技术的突围,更标志着在具身智能的下半场,中国科技公司正试图用 「开源定义标准」 的新范式,重写全球 AI 创新的游戏规则。2026,好戏正在上演。
【文章来源:techweb】
【TechWeb】 最近 AI 圈的一大看点,莫过于蚂蚁灵波和谷歌的 「开源接力」。
先是蚂蚁灵波密集出手,从 1 月 27 日开始,四天连续开源四大核心模型,其中可对标谷歌 Genie 3 的开源世界模型 LingBot-World 一经发布,谷歌火速跟进,于 1 月 30 日面向特定用户开放世界模型体验平台 Project Genie。
这场前后脚的动作,瞬间引爆全球 AI 社区,相关话题全天占据 X 热门榜单首位。蚂蚁牵头开源世界模型为啥能引起这么大的反响,让老外都直呼 「Amazing」?
蚂蚁撕开缺口 海外 AI 圈炸锅
在海外社交平台,蚂蚁 LingBot-World 的 Demo 一放出,即吸引到不少海外网友疯狂打 call,直呼这个来自中国的模型太震撼了。
从画面呈现来看,LingBot-World 视觉效果已经可以做到与谷歌推出的 Genie 3 不相上下,但时间维度明显更长。
据了解,LingBot-World 能做到近 10 分钟连续无损生成,物体特征、场景逻辑始终保持一致,就像真实世界一样稳定。
而且 LingBot-World 生成的视频不仅能看,还可以深度参与其中。你可以通过键盘或鼠标操控角色与相机视角,画面随指令即时反馈。
你还能以文本指令触发天气、风格等环境变化,且在镜头最长移动 60 秒返回后,目标物体仍能保持物体结构和外观的一致性。

整个过程,端到端交互延迟控制在 1 秒以内,也就是说,你操作后,世界立刻会有反应。生成帧率约 16 FPS,画面流畅不卡顿。
值得一提的是,该模型具备 Zero-shot 泛化能力,只需要输入一张真实照片 (如城市街景) 或游戏截图,就可以生成可交互的视频流,无需再针对单一场景进行额外训练或数据采集,从而解决具身智能训练成本高、泛化能力弱的行业核心痛点。
长期以来,全球高端 AI 模型多走闭源路线,谷歌、OpenAI 等巨头牢牢把控核心技术,形成行业壁垒。如果学术界和初创公司想训练一个高质量的世界模型,门槛是极高的。
而蚂蚁 LingBot-World 的发布,让大家看到,中国也有 SOTA 级的世界模型,而且还是开源的。
德国头部财经网站 AdHocNews 评价称,「蚂蚁集团发布了名为 LingBot-World 的高质量机器人 AI 模拟环境。这家中国科技公司完善了一套完整的开源工具包,用于物理 AI 系统的开发。这也是在全球机器人领域主导权争夺战中的一项战略性举措。」

还有行业专家直言,「这对整个行业都是变革,此前这类训练环境通常是专有的,成本昂贵。现在,每位开发者都能接触到工业标准技术。」
有意思的是,LingBot-World 在 X 上发布后,谷歌就宣布开源体验平台 Project Genie,部分用户可以试用 Genie 3。
两大巨头先后官宣,世界模型开源开放的窗口被打开,海外社区反响热烈,相关话题全天占据 X 热门榜单首位,Reddit 多个 AI 子社区将其列为 Top 1 热帖。
四大开源模型齐亮相 具身智能 「全能工具箱」 有了
蚂蚁灵波在开源世界模型 LingBot-World 之外,还相继开源了高精度空间感知模型 LingBot-Depth、具身大模型 LingBot-VLA 和具身世界模型 LingBot-VA。这四大开源模型并非孤立存在,而是层层递进,构建起从 「感知」 到 「行动」 再到 「认知」 的完整技术链条,实现从虚拟预训练到真实世界部署的无缝衔接,解决具身智能 「训练成本高、泛化难、执行偏差」 等核心挑战。
其中,LingBot-Depth 相当于机器人的 「眼睛」,主攻透明反光物抓取这一行业痛点,能帮助机器人更精准地识别物体三维空间关系。蚂蚁还与奥比中光深度合作,后者计划基于 LinBot-Depth 打造了新一代深度相机。
LingBot-VLA 相当于机器人的 「通用大脑」,基于 20000+小时真实机器人操作数据训练而成,能同时适配 9 种主流双臂机器人构型,实现 「一脑多机」,从而缓解具身智能模型落地面临的泛化性问题。这也是蚂蚁开源的第一款具身智能基座模型。
LingBot-World 相当于机器人的 「数字训练场」,为具身智能、自动驾驶、游戏开发提供低成本的虚拟训练环境。
LingBot-VA 则将大规模视频生成模型与机器人控制深度融合,让机器人能够像人一样 「边推演、边行动」,打通世界模型到物理执行的最后一公里。真机评测中,LingBot-VA 在多项高难操作任务上性能超越业界标杆 Pi0.5。

写在最后:
蚂蚁灵波四大模型的全链条开源,对其自身、行业乃至全球格局来说,都有着不小的影响。
此前,高端 AI 模型的研发和使用门槛极高,中小企业和初创公司因资金、算力不足,难以涉足前沿领域。蚂蚁的开源举措,相当于免费向全球开发者开放工业级技术工具包,让开发者无需从零造轮子,仅凭消费级硬件就能部署和微调模型。
特别是世界模型,于全球格局而言,蚂蚁率先撕开了高性能世界模型闭源缺口,展现了国产 AI 的技术实力,谷歌同期调整策略,世界模型赛道从封闭竞争转向开放协同。
开源普惠,不仅激活了中小企业的创新活力,更让 AI 技术从少数巨头专属走向全民共享,加速技术迭代速度。也让蚂蚁在具身智能、世界模型赛道确立了先发优势。
这不仅是一次技术的突围,更标志着在具身智能的下半场,中国科技公司正试图用 「开源定义标准」 的新范式,重写全球 AI 创新的游戏规则。2026,好戏正在上演。



