Google正在升级其图像生成模型,新增编辑功能、更高分辨率、更准确的文本渲染以及网络搜索能力。
这款名为Nano Banana Pro的新模型基于Google本周早些时候发布的最新大语言模型Gemini 3构建。公司声称,Nano Banana Pro在前代产品Nano Banana的基础上有所改进,能够创建更详细的图像和准确的文本,并可以生成不同风格、字体和语言的文本。
该模型还具备网络搜索功能,用户可以要求它查找食谱并生成学习卡片等。
Google表示,Nano Banana Pro旨在为专业人士提供对图像的更多控制,让用户能够控制相机角度、场景照明、景深、焦点和色彩分级等方面。与Nano Banana的1024 x 1024像素分辨率上限相比,用户现在可以使用Nano Banana Pro生成2K或4K图像。
公司指出,虽然Nano Banana Pro可以生成更高质量的图像,但它比原始模型更慢且成本更高。原始模型每张1024像素图像的成本为0.039美元,相比之下,新模型每张1080p或2K图像的成本为0.139美元,每张4K图像的成本为0.24美元。
新模型可以使用六个高保真镜头或在一张图像中融合多达14个对象。它还可以保持多达五个人的一致性和相似性。公司已发布一个演示应用程序,用户可以尝试其中一些功能。
Nano Banana Pro正在Google现有的许多AI工具中推出。Gemini应用现在将默认使用新模型生成图像,不过免费订阅用户只能使用该模型生成有限数量的图像,超出限制后将默认使用原始的Nano Banana模型。
Google AI Plus、Pro和Ultra订阅用户将获得更高的生成限制,尽管公司没有透露确切的限制数量。这些订阅用户还可以在NotebookLM中访问该模型。
Google还通过AI模式在搜索中为美国的AI Pro和Ultra订阅用户提供该模型。Ultra订阅用户可以在公司的视频工具Flow中访问该模型,Workspace客户也可以在Google Slides和Vids中使用。
开发者可以通过Gemini API、Google AI Studio和公司的新IDE Antigravity使用Nano Banana Pro。
公司还将其用于为AI生成图像添加水印和检测的SynthID技术集成到Gemini应用中。用户可以上传图像,聊天机器人会告诉他们该图像是否由公司的图像模型创建或修改。
Google表示,随着时间的推移,它将包含对C2PA内容凭证检测的支持,用于内容验证。
Q&A
Q1:Nano Banana Pro相比前代产品有哪些改进?
A:Nano Banana Pro在前代Nano Banana基础上实现了多项改进:能够创建更详细的图像和准确的文本,可以生成不同风格、字体和语言的文本,支持2K和4K高分辨率图像生成,具备网络搜索功能,并为专业人士提供更多图像控制选项,包括相机角度、场景照明、景深、焦点和色彩分级等。
Q2:使用Nano Banana Pro的成本是多少?
A:Nano Banana Pro的使用成本比原始模型更高。原始Nano Banana模型每张1024像素图像成本为0.039美元,而Nano Banana Pro每张1080p或2K图像成本为0.139美元,每张4K图像成本为0.24美元。虽然成本更高,但能提供更高质量的图像输出。
Q3:哪些Google产品可以使用Nano Banana Pro?
A:Nano Banana Pro已集成到多个Google产品中:Gemini应用默认使用该模型生成图像,NotebookLM为付费订阅用户提供访问,美国的AI Pro和Ultra用户可在搜索的AI模式中使用,Ultra用户可在视频工具Flow中访问,Workspace客户可在Google Slides和Vids中使用,开发者可通过Gemini API、Google AI Studio和Antigravity IDE使用。
好文章,需要你的鼓励
谷歌推出升级版图像生成模型Nano Banana Pro,基于最新Gemini 3语言模型构建。新模型支持更高分辨率(2K/4K)、准确文本渲染、网络搜索功能,并提供专业级图像控制能力,包括摄像角度、场景光照、景深等。虽然质量更高但成本也相应增加,1080p图像费用为0.139美元。模型已集成到Gemini应用、NotebookLM等多个谷歌AI工具中,并通过API向开发者开放。
慕尼黑大学联合多所知名院校的研究团队发现,AI深度研究助手虽然能力强大,但存在严重安全漏洞。通过"计划注入"和"意图劫持"两种新攻击方法,这些AI助手可能绕过安全防护,生成比普通AI更详细、更危险的有害内容。研究测试了六款主流AI模型,发现在医学等敏感领域风险尤其突出。团队开发了新的安全评估框架并提出多层防护建议。
谷歌为Gemini应用和网页版发布SynthID检测器,允许用户上传图像判断是否由AI生成。但该功能局限性明显,仅能识别带有谷歌SynthID水印的Gemini生成图像。同时谷歌还发布了Nano Banana Pro图像生成引擎升级版,基于Gemini 3 Pro模型,专门优化文本生成清晰度,可创建包含可读内容的信息图表。
牛津大学研究团队发现了针对AI推理安全系统的四种"黑科技"攻击方法,能以超过90%的成功率让最先进的安全防护失效。这些方法利用AI对话模板的结构性缺陷,从简单的符号插入到复杂的推理劫持,门槛极低但威力巨大。研究揭示了当前AI安全架构的根本性问题,特别是在开源AI时代,这些漏洞的影响范围前所未有。