谷歌连续炸场！新一代 AI 图像生成模型发布还能识别真假 AI 图片

来源：
澎湃新闻

　　科技巨头谷歌密集发布 AI（人工智能）模型。

　　当地时间 11 月 20 日，谷歌旗下图像生成模型 Nano Banana 在推出三个月后迎来重磅更新，基于谷歌最新大模型 Gemini 3 Pro 搭建的 Nano Banana Pro 正式亮相。同时，谷歌为用户提供了更简单的数字水印验证方式，提高 AI 内容的透明度。

　　据介绍，Nano Banana Pro 能够「以空前的控制力、改进的文字呈现和增强的世界知识，将用户的构想变成工作室级的设计」，不仅在细节表现力、图像分辨率和文本渲染准确性方面均有升级，还能以不同风格、字体和语言生成文本。

　　首先，Nano Banana Pro 的文字渲染能力获得大幅提升。结合多模态理解能力，模型可以直接把图片中的文字翻译成其他语言，并保持原有的设计风格不变。

Nano Banana Pro 的文字渲染能力获得大幅提升。来源：谷歌

　　此外，还改进了局部编辑功能，并加入互联网搜索能力。用户可以选择、优化和调整图像的任何部分，调整相机角度、改变焦点和色彩分级，甚至改变场景光照。Nano Banana Pro 能够生成分辨率高达 2K 和 4K 的图像，并支持调整宽高比。

　　在一致性方面，Nano Banana Pro 也实现了大幅提升，现在支持输入最多 14 张图片，在复杂场景的生成结果中也能保持一致性。该模型还能够在生成结果中保持最多 5 位人物的一致性和相似度。

根据提示词，Nano Banana Pro 能够在复杂构图中保持多输入的一致性。来源：谷歌

　　同时，谷歌宣布，用户将可以直接用 Gemini 鉴定一张图片是否由谷歌 AI 生成。谷歌表示，所有由谷歌工具生成的媒介都嵌入了 SynthID 数字水印，用户从现在起可以将图片上传到 Gemini 应用，轻松查询图片是否由 Google AI 生成，这项验证方式将很快扩展到音频和视频。

　　目前，Nano Banana Pro 已经在 Gemini 应用中开放使用，免费用户拥有限定的使用次数，超出后会回到 Nano Banana 模型，Google AI Plus、Pro 和 Ultra 订阅用户则享有更高的配额。该模型也从即日起在设计软件 Adobe Photoshop 和 Firefly 中提供。

　　一经发布，Nano Banana Pro 和 Gemini 3 一样获得了热烈反响。两天前，谷歌正式发布新一代多模态 AI模型 Gemini 3，包括 Gemini 3 Pro 和增强型推理模式 Gemini 3 Deep Think 两个版本。该模型基于谷歌 TPU（张量处理单元）进行训练，不仅横扫各大基准测试榜单，还展现了 Gemini 系列在多模态领域的一贯优势。

　　在 AI 竞赛中，谷歌一直在努力追赶 OpenAI。分析指出，随着 Gemini 3 的发布，两家公司之间的竞争愈演愈烈。一周前，OpenAI 发布了让 ChatGPT「更智能、对话感更强、更易于定制」的 GPT-5.1。11 月 19 日，OpenAI 又毫无预告地发布了 GPT-5.1 Pro 和代码模型 GPT-5.1-Codex-Max。

　　在发布 Gemini 3 时，谷歌 CEO 桑达尔·皮查伊（Sundar Pichai）表示，目前每月有 20 亿用户使用 AI 概览（谷歌搜索的 AI Overviews 功能），Gemini app 的月用户量已突破 6.5 亿。

　　11 月 20 日，受到大盘普跌的影响，谷歌（Nasdaq：GOOGL）跌 1.03% 收于每股 289.98 美元，总市值 3.49 万亿美元。今年以来，谷歌股价已涨超 50%。

　　东财图解·加点干货

（澎湃新闻）

文章转载自东方财富

一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30