北京时间周五凌晨,美国科技公司谷歌宣布上架新一代图像生成模型 Nano Banana 2,使得高质量图像的生成更快、更便宜、更容易。

作为背景,谷歌于去年 8 月底首发 Nano Banana(Gemini 2.5 Flash 图像模型)。由于其超级逼真的角色一致性,以及突出的自然语言理解和 3D 建模能力,引发全球网友狂热追捧,一举奠定谷歌在 AI 应用领域的江湖地位。
去年 11 月,谷歌趁热推出 Nano Banana Pro(Gemini 3 Pro 图像模型),允许用户生成更加精细、更高质量的图片,并提供 「工作室级别的创作控制」。
根据谷歌的说法,Nano Banana 2(即 Gemini 3.1 Flash 图像模型) 能够兼具 Nano Banana Pro 的图像生成质量、推理能力和先进世界知识,以及 Flash 模型的 「闪电生成速度」。
这意味着一系列曾经专属于 「Pro」 系列模型的功能下放到最基础的版本。Nano Banana 2 同样支持最多 5 个角色的相貌一致及 14 个物体的忠实呈现。自然语言理解能力的提升,使得模型更精准地捕捉复杂提示词的细微差别,从而生成更贴近想法的图像。

新一代产品支持设置各种纵横比和最高 4K 分辨率,并能提供更生动的光照、更丰富的纹理和更清晰的细节。
Pro 图像模型的精准文本呈现和多语种翻译能力也得到继承。此前该功能仅限于 Gemini 订阅用户使用,随着 Nano Banana 2 上架,免费版 Gemini 用户也能使用该功能。

据 「大模型竞技场」Arena.ai 披露,Nano Banana 2 上架后即刻登顶文生图榜单的第一位。同时每张图像的成本只有 0.067 美元,约为 Nano Banana Pro 的一半。

即日起,Nano Banana 2 已经成为谷歌 Gemini、搜索和视频编辑工具 Flow 中的默认图像模型。Nano Banana 2 模型将取代 Gemini 应用中 Fast、Thinking 和 Pro 生成功能里的 Nano Banana Pro 选项。
(财联社)
文章转载自 东方财富