谷歌 Nano Banana Pro 亮相：打工人的「图像生成神器」来了！

约 20 万元起售，「丐版」特斯拉即将入华

OpenAI 宣布 ChatGPT 将引入广告强调用户数据不会出售给广告商

　　北京时间周四深夜，AI 巨头谷歌麾下的 Nano Banana 图像生成模型迎来重磅更新——Nano Banana Pro 闪亮登场！

　　作为背景，谷歌于今年 8 月底发布基于 Gemini 2.5 Flash 模型的 Nano Banana。由于该模型能够将人物或者动漫照片变成栩栩如生的「3D 打印手办」，短时间内形成全球范围内的破圈效应。谷歌 CEO 皮查伊披露，在 Nano Banana 的推动下，Gemini 应用的月活用户数在短短 1 个季度内，就从 4.5 亿暴增至 6.5 亿。

　　随着本周谷歌发布新一代旗舰大模型，谷歌的图像生成模型也迎来了意料之中的飞跃式升级。

　　用谷歌的话来讲，Nano Banana Pro 能「以空前的控制力、无瑕的文字呈现和增强的世界知识，将用户的构想变成工作室级的设计」。

　　据谷歌介绍，Nano Banana Pro 基于本周早些时候发布的 Gemini 3 Pro，不仅在细节表现力、图像分辨率和文本渲染准确性方面强于前一代 Nano Banana，还能以不同风格、字体和语言生成文本。新一代图像生成模型还新增了编辑功能，并加入互联网搜索能力。

　　谷歌强调，Nano Banana Pro 是在图像中生成正确且清晰可读文字的最佳 AI 模型，不论是简短的标语还是长段落均可，支持更加丰富的纹理、字体和书法。同时借助 Gemini 增强的多语言推理能力，用户可以生成多种语言的文本，或者对内容进行翻译和本地化。

　　（将一张照片转化为电影分镜，以及翻译饮料包装上的文字，来源：谷歌）

　　同时基于互联网知识库，Nano Banana Pro 还能将现实世界的信息转化为生动形象的可视化信息，例如如何制作一杯豆蔻茶。

　　谷歌透露，Nano Banana Pro 也非常适合用来做 PPT 或者信息图表，同时会加入谷歌的办公套件 Workspace。

　　Google Labs 和 Gemini 副总裁 Josh Woodward 介绍称：「Nano Banana Pro 在信息图表方面非常出色，可以用来制作幻灯片。它最多可以处理 14 张不同的图像，或 5 个不同的角色，并在某种程度上保持角色一致性。」

　　对于创意产业的工作者而言，Nano Banana Pro 也大幅升级了编辑功能，直接将创意的决策权交到使用者手中。

　　谷歌介绍称，新的编辑功能支持改变相机角度、场景光线、景深、对焦等，同时可以调整多种纵横比，分辨率也从 Nano Banana 的 1024X1024 上升到最高 4K。

　　（调整角度或图片焦点）

　　谷歌正在各项 AI 工具中推出 Nano Banana Pro，包括免费用户在内，都能在 Gemini 等应用中试用这一新功能（但会有配额限制）。Google AI Plus、Pro 和 Ultra 订阅用户会获得更高的配额。谷歌也表示，该功能随后也将率先在 Flow（谷歌的 AI 电影制作工具）向 Ultra 订阅用户推出。

（财联社）

文章转载自东方财富

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31