Google正在升级其图像生成模型,新增编辑功能、更高分辨率、更准确的文本渲染以及网络搜索能力。
这款名为Nano Banana Pro的新模型基于Google本周早些时候发布的最新大语言模型Gemini 3构建。公司声称,Nano Banana Pro在前代产品Nano Banana的基础上有所改进,能够创建更详细的图像和准确的文本,并可以生成不同风格、字体和语言的文本。
该模型还具备网络搜索功能,用户可以要求它查找食谱并生成学习卡片等。
Google表示,Nano Banana Pro旨在为专业人士提供对图像的更多控制,让用户能够控制相机角度、场景照明、景深、焦点和色彩分级等方面。与Nano Banana的1024 x 1024像素分辨率上限相比,用户现在可以使用Nano Banana Pro生成2K或4K图像。
公司指出,虽然Nano Banana Pro可以生成更高质量的图像,但它比原始模型更慢且成本更高。原始模型每张1024像素图像的成本为0.039美元,相比之下,新模型每张1080p或2K图像的成本为0.139美元,每张4K图像的成本为0.24美元。
新模型可以使用六个高保真镜头或在一张图像中融合多达14个对象。它还可以保持多达五个人的一致性和相似性。公司已发布一个演示应用程序,用户可以尝试其中一些功能。
Nano Banana Pro正在Google现有的许多AI工具中推出。Gemini应用现在将默认使用新模型生成图像,不过免费订阅用户只能使用该模型生成有限数量的图像,超出限制后将默认使用原始的Nano Banana模型。
Google AI Plus、Pro和Ultra订阅用户将获得更高的生成限制,尽管公司没有透露确切的限制数量。这些订阅用户还可以在NotebookLM中访问该模型。
Google还通过AI模式在搜索中为美国的AI Pro和Ultra订阅用户提供该模型。Ultra订阅用户可以在公司的视频工具Flow中访问该模型,Workspace客户也可以在Google Slides和Vids中使用。
开发者可以通过Gemini API、Google AI Studio和公司的新IDE Antigravity使用Nano Banana Pro。
公司还将其用于为AI生成图像添加水印和检测的SynthID技术集成到Gemini应用中。用户可以上传图像,聊天机器人会告诉他们该图像是否由公司的图像模型创建或修改。
Google表示,随着时间的推移,它将包含对C2PA内容凭证检测的支持,用于内容验证。
Q&A
Q1:Nano Banana Pro相比前代产品有哪些改进?
A:Nano Banana Pro在前代Nano Banana基础上实现了多项改进:能够创建更详细的图像和准确的文本,可以生成不同风格、字体和语言的文本,支持2K和4K高分辨率图像生成,具备网络搜索功能,并为专业人士提供更多图像控制选项,包括相机角度、场景照明、景深、焦点和色彩分级等。
Q2:使用Nano Banana Pro的成本是多少?
A:Nano Banana Pro的使用成本比原始模型更高。原始Nano Banana模型每张1024像素图像成本为0.039美元,而Nano Banana Pro每张1080p或2K图像成本为0.139美元,每张4K图像成本为0.24美元。虽然成本更高,但能提供更高质量的图像输出。
Q3:哪些Google产品可以使用Nano Banana Pro?
A:Nano Banana Pro已集成到多个Google产品中:Gemini应用默认使用该模型生成图像,NotebookLM为付费订阅用户提供访问,美国的AI Pro和Ultra用户可在搜索的AI模式中使用,Ultra用户可在视频工具Flow中访问,Workspace客户可在Google Slides和Vids中使用,开发者可通过Gemini API、Google AI Studio和Antigravity IDE使用。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。