谷歌向免费用户开放更强大的AI图像生成工具
免费Gemini用户现在可以生成包含实时信息、可读文本等功能的图像。
谷歌正在为免费用户推出更强大版本的Nano Banana AI图像模型。Nano Banana 2(也称为Gemini 3.1 Flash Image)今日在Gemini应用和其他谷歌AI平台上线,让之前仅限于Nano Banana Pro用户的知识库和渲染功能面向所有人开放。谷歌表示,此次更新旨在将"Gemini Flash的高速智能引入视觉生成",让复杂图像的生成变得更快、更便宜、更简单。
与Nano Banana Pro一样,Nano Banana 2模型利用实时信息、网络搜索图片和Gemini的现实世界知识库。谷歌DeepMind产品经理Naina Raisinghani表示,这为创建信息图表或图解提供了更相关的数据,并允许Nano Banana 2更准确地渲染"特定主题",不过未提供此类主题的具体示例。
从Nano Banana Pro继承的其他功能包括生成准确、清晰可读文本的图像,以及本地化翻译。这些功能此前需要订阅谷歌AI Plus、Pro或Ultra付费服务才能在Gemini中使用,但现在将扩展到免费Gemini用户和谷歌搜索的AI模式中。
与原始Nano Banana模型相比,Nano Banana 2对生成图像提供了更多创意控制。谷歌表示,视觉改进包括更生动的光照、更丰富的纹理和更锐利的细节,同时能够更严格地遵循复杂的图像请求。在单个工作流程中,最多可以更一致地保持五个角色和14个对象的外观,用户还可以"完全控制"宽高比和图像分辨率,分辨率范围从512px到4K。
新的Nano Banana 2模型将在Gemini应用的快速、思考和专业生成模式中取代Nano Banana Pro选项。谷歌表示,AI Pro和Ultra订阅者仍然可以通过选择图像上的三点菜单重新生成图像来访问Nano Banana Pro进行"专门任务"。新模型还正在推广到搜索的AI模式、Google Lens、谷歌应用以及移动端和桌面端浏览器,同时成为谷歌AI视频工具Flow中新的默认图像生成模型。
Q&A
Q1:Nano Banana 2有什么新功能?
A:Nano Banana 2具备实时信息获取、网络搜索图片、生成清晰可读文本、本地化翻译等功能。视觉方面有更生动的光照、更丰富的纹理和更锐利的细节,支持4K分辨率,可保持最多5个角色和14个对象在单个工作流程中的一致外观。
Q2:免费用户能使用所有Nano Banana 2功能吗?
A:是的,Nano Banana 2的主要功能现在对免费Gemini用户开放,包括之前需要付费订阅才能使用的实时信息、清晰文本生成和本地化翻译功能。这些功能也扩展到了谷歌搜索的AI模式中。
Q3:Nano Banana 2在哪些谷歌产品中可用?
A:Nano Banana 2已在Gemini应用、谷歌搜索AI模式、Google Lens、谷歌应用以及移动端和桌面端浏览器中推出,同时也是谷歌AI视频工具Flow的新默认图像生成模型。
好文章,需要你的鼓励
谷歌宣布为旗下互动世界构建工具Project Genie新增Google街景功能,用户可基于真实地点生成可探索的游戏世界。只需选定美国境内的地图位置,描述角色形象,并选择"沙漠"或"石器时代"等风格,系统即可生成与现实街景绑定的沉浸式虚拟场景。每次游玩时长限60秒,支持WASD操控,目前仅向AI Ultra订阅用户开放,后续将逐步扩展覆盖范围。
新加坡国立大学构建了首个视频隐喻理解基准ViMU,含588段视频与2352道题,测试16个主流AI模型均未超过50%,揭示AI在视频潜台词理解上的系统性短板。
随着AI编程工具的普及,越来越多的非开发者开始尝试自己构建应用。谷歌在I/O大会上宣布,AI Studio新增功能可让用户通过提示词快速生成原生Android应用,并直接导出到手机。此外,谷歌还推出了基于Gemini的自定义小组件功能,并提出"生成式UI"概念,让手机界面根据需求实时生成。与此同时,苹果据报道也在探索通过提示词创建快捷指令的功能,手机个性化体验或将迎来新突破。
浙江大学等机构联合提出PanoWorld,通过球面空间交叉注意力和57万张全景图训练数据,让AI能直接理解360度全景图的空间结构,在导航和视觉搜索任务中大幅超越现有方法。