北京时间周四深夜,AI 巨头谷歌麾下的 Nano Banana 图像生成模型迎来重磅更新——Nano Banana Pro 闪亮登场!
作为背景,谷歌于今年 8 月底发布基于 Gemini 2.5 Flash 模型的 Nano Banana。由于该模型能够将人物或者动漫照片变成栩栩如生的 「3D 打印手办」,短时间内形成全球范围内的破圈效应。谷歌 CEO 皮查伊披露,在 Nano Banana 的推动下,Gemini 应用的月活用户数在短短 1 个季度内,就从 4.5 亿暴增至 6.5 亿。
随着本周谷歌发布新一代旗舰大模型,谷歌的图像生成模型也迎来了意料之中的飞跃式升级。
用谷歌的话来讲,Nano Banana Pro 能 「以空前的控制力、无瑕的文字呈现和增强的世界知识,将用户的构想变成工作室级的设计」。
据谷歌介绍,Nano Banana Pro 基于本周早些时候发布的 Gemini 3 Pro,不仅在细节表现力、图像分辨率和文本渲染准确性方面强于前一代 Nano Banana,还能以不同风格、字体和语言生成文本。新一代图像生成模型还新增了编辑功能,并加入互联网搜索能力。
谷歌强调,Nano Banana Pro 是在图像中生成正确且清晰可读文字的最佳 AI 模型,不论是简短的标语还是长段落均可,支持更加丰富的纹理、字体和书法。同时借助 Gemini 增强的多语言推理能力,用户可以生成多种语言的文本,或者对内容进行翻译和本地化。


(将一张照片转化为电影分镜,以及翻译饮料包装上的文字,来源:谷歌)
同时基于互联网知识库,Nano Banana Pro 还能将现实世界的信息转化为生动形象的可视化信息,例如如何制作一杯豆蔻茶。

谷歌透露,Nano Banana Pro 也非常适合用来做 PPT 或者信息图表,同时会加入谷歌的办公套件 Workspace。
Google Labs 和 Gemini 副总裁 Josh Woodward 介绍称:「Nano Banana Pro 在信息图表方面非常出色,可以用来制作幻灯片。它最多可以处理 14 张不同的图像,或 5 个不同的角色,并在某种程度上保持角色一致性。」

对于创意产业的工作者而言,Nano Banana Pro 也大幅升级了编辑功能,直接将创意的决策权交到使用者手中。
谷歌介绍称,新的编辑功能支持改变相机角度、场景光线、景深、对焦等,同时可以调整多种纵横比,分辨率也从 Nano Banana 的 1024X1024 上升到最高 4K。


(调整角度或图片焦点)
谷歌正在各项 AI 工具中推出 Nano Banana Pro,包括免费用户在内,都能在 Gemini 等应用中试用这一新功能(但会有配额限制)。Google AI Plus、Pro 和 Ultra 订阅用户会获得更高的配额。谷歌也表示,该功能随后也将率先在 Flow(谷歌的 AI 电影制作工具) 向 Ultra 订阅用户推出。

(财联社)
文章转载自 东方财富



