来源:
澎湃新闻
科技巨头谷歌密集发布 AI(人工智能) 模型。
当地时间 11 月 20 日,谷歌旗下图像生成模型 Nano Banana 在推出三个月后迎来重磅更新,基于谷歌最新大模型 Gemini 3 Pro 搭建的 Nano Banana Pro 正式亮相。同时,谷歌为用户提供了更简单的数字水印验证方式,提高 AI 内容的透明度。
据介绍,Nano Banana Pro 能够 「以空前的控制力、改进的文字呈现和增强的世界知识,将用户的构想变成工作室级的设计」,不仅在细节表现力、图像分辨率和文本渲染准确性方面均有升级,还能以不同风格、字体和语言生成文本。
首先,Nano Banana Pro 的文字渲染能力获得大幅提升。结合多模态理解能力,模型可以直接把图片中的文字翻译成其他语言,并保持原有的设计风格不变。

Nano Banana Pro 的文字渲染能力获得大幅提升。来源:谷歌
此外,还改进了局部编辑功能,并加入互联网搜索能力。用户可以选择、优化和调整图像的任何部分,调整相机角度、改变焦点和色彩分级,甚至改变场景光照。Nano Banana Pro 能够生成分辨率高达 2K 和 4K 的图像,并支持调整宽高比。
在一致性方面,Nano Banana Pro 也实现了大幅提升,现在支持输入最多 14 张图片,在复杂场景的生成结果中也能保持一致性。该模型还能够在生成结果中保持最多 5 位人物的一致性和相似度。

根据提示词,Nano Banana Pro 能够在复杂构图中保持多输入的一致性。来源:谷歌
同时,谷歌宣布,用户将可以直接用 Gemini 鉴定一张图片是否由谷歌 AI 生成。谷歌表示,所有由谷歌工具生成的媒介都嵌入了 SynthID 数字水印,用户从现在起可以将图片上传到 Gemini 应用,轻松查询图片是否由 Google AI 生成,这项验证方式将很快扩展到音频和视频。
目前,Nano Banana Pro 已经在 Gemini 应用中开放使用,免费用户拥有限定的使用次数,超出后会回到 Nano Banana 模型,Google AI Plus、Pro 和 Ultra 订阅用户则享有更高的配额。该模型也从即日起在设计软件 Adobe Photoshop 和 Firefly 中提供。
一经发布,Nano Banana Pro 和 Gemini 3 一样获得了热烈反响。两天前,谷歌正式发布新一代多模态 AI模型 Gemini 3,包括 Gemini 3 Pro 和增强型推理模式 Gemini 3 Deep Think 两个版本。该模型基于谷歌 TPU(张量处理单元) 进行训练,不仅横扫各大基准测试榜单,还展现了 Gemini 系列在多模态领域的一贯优势。
在 AI 竞赛中,谷歌一直在努力追赶 OpenAI。分析指出,随着 Gemini 3 的发布,两家公司之间的竞争愈演愈烈。一周前,OpenAI 发布了让 ChatGPT「更智能、对话感更强、更易于定制」 的 GPT-5.1。11 月 19 日,OpenAI 又毫无预告地发布了 GPT-5.1 Pro 和代码模型 GPT-5.1-Codex-Max。
在发布 Gemini 3 时,谷歌 CEO 桑达尔·皮查伊 (Sundar Pichai) 表示,目前每月有 20 亿用户使用 AI 概览 (谷歌搜索的 AI Overviews 功能),Gemini app 的月用户量已突破 6.5 亿。
11 月 20 日,受到大盘普跌的影响,谷歌 (Nasdaq:GOOGL) 跌 1.03% 收于每股 289.98 美元,总市值 3.49 万亿美元。今年以来,谷歌股价已涨超 50%。

东财图解·加点干货

(澎湃新闻)
文章转载自东方财富

