谷歌今日宣布推出其热门图像生成模型的最新版本Nano Banana 2。这个新模型在技术上是Gemini 3.1 Flash Image,能够创建比前代更逼真的图像。该模型现在也将成为Gemini应用程序中快速模式、思考模式和专业模式的默认选择。
公司首次在2025年8月发布了Nano Banana,促使人们在Gemini应用中生成了数百万张图像,特别是在印度等国家。11月,公司发布了Nano Banana Pro,允许用户创建更详细和高质量的图像。
新的Nano Banana 2保留了Pro模型的一些高保真特性,但生成图像的速度更快。公司表示,你可以创建分辨率从512像素到4K的图像,支持不同的纵横比。
Nano Banana 2可以在一个工作流程中保持最多五个角色的一致性,以及最多14个对象的保真度,从而实现更好的故事叙述。谷歌表示,用户还可以发出包含详细细节的复杂图像生成请求。此外,用户可以创建具有更生动照明、更丰富纹理和更清晰细节的媒体内容。
随着发布,Nano Banana 2将成为Gemini应用程序中所有应用的默认图像生成模型。公司还将其设为视频编辑工具Flow中图像生成的默认模型。
在搜索方面,Nano Banana 2将通过谷歌镜头在谷歌搜索结果中成为默认选择,并在141个国家的谷歌应用程序和网页版的AI模式中使用,覆盖桌面和移动端。
在谷歌的高端计划Google AI Pro和Ultra中,订阅者可以通过三点菜单重新生成图像,继续使用Nano Banana Pro进行专业任务。
对于开发者,Nano Banana 2将通过Gemini API、Gemini CLI和Vertex API进行预览。它还将通过AI Studio和公司去年11月发布的开发工具Antigravity提供。
公司表示,通过新模型创建的所有图像都将带有SynthID水印,这是谷歌用于标记AI生成图像的标识。这些图像还与C2PA内容凭证互操作,该标准由包括Adobe、微软、谷歌、OpenAI和Meta在内的行业机构创建。谷歌表示,自11月在Gemini应用中推出SynthID验证功能以来,人们已经使用了超过2000万次。
Q&A
Q1:Nano Banana 2相比前代有哪些改进?
A:Nano Banana 2保留了Pro模型的高保真特性,但生成图像速度更快。支持512像素到4K分辨率,可维持最多5个角色一致性和14个对象保真度,还能处理更复杂的生成请求,创造更生动的照明效果和更丰富的纹理细节。
Q2:Nano Banana 2在哪些产品中可以使用?
A:Nano Banana 2将成为Gemini应用所有模式的默认图像生成模型,也是视频编辑工具Flow的默认选择。在搜索中,它通过谷歌镜头和AI模式在141个国家提供服务。开发者可通过Gemini API、CLI和Vertex API使用。
Q3:如何识别Nano Banana 2生成的AI图像?
A:所有通过Nano Banana 2创建的图像都会自动添加SynthID水印,这是谷歌的AI图像标识。图像还支持C2PA内容凭证标准,该标准由Adobe、微软、谷歌等多家公司共同制定,用于标记AI生成内容。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。