谷歌推出Gemini Omni Flash与Nano Banana 2 Lite,助力高效媒体创作

谷歌在Gemini企业智能体平台推出两款新媒体模型:Gemini Omni Flash和Nano Banana 2 Lite。前者面向高端视频与音频生成,支持自然语言对话式编辑,视频输出定价仅为每秒0.1美元;后者专注极速图像生成,最快4秒即可输出专业级图像。WPP、Figma、Manus AI等企业已率先接入。两款模型均支持CP2A内容凭证与SynthID水印,保障生成内容的真实性。

谷歌正通过在Gemini企业智能体平台中推出两款新媒体模型,进一步强化其面向创作者的生成式AI能力。

新加入的两款模型分别为Gemini Omni Flash与Nano Banana 2 Lite。谷歌表示,这两款模型旨在以更低的价格实现更高质量的图像和视频生成,目前在业内具备极具竞争力的性价比。借助这两款新模型,创作者将获得更短的素材生成时间和更低的制作成本,从而能够大规模生产高质量的媒体内容。

Gemini企业智能体平台专为希望大规模部署自主AI智能体的企业而设计,在创作者和数字营销人员群体中尤为受欢迎。该平台提供统一的工作环境,让用户可以将复杂的媒体工具嵌入智能体工作流程,实现内容创作的自动化与流程整合。用户无需在不同的视频和图像编辑工具之间反复切换,便可在同一平台上完成数字资产的设计、构建、二次创作与发布。

Gemini Omni Flash现已进入公开预览阶段。这是一款面向高端视频和音频生成的先进多模态模型。谷歌云产品管理副总裁Michael Gerstenhaber表示,该模型的定价极具竞争力,用户仅需为每秒视频输出支付0.1美元。该模型的核心亮点在于其对话式编辑工具——用户只需使用自然语言指令,即可替换视频中的角色、调整镜头角度、重新布置场景光效。

创作者还可以向该模型上传视频、文本和图片,辅助内容生成,例如让模型在输出内容中模仿所提供素材的风格。Gerstenhaber表示,Gemini Omni Flash在生成带有同步音频的视频方面表现尤为出色。此外,谷歌还为该模型引入了文本与动作同步功能,确保视频中的文字在画面存在动态内容时依然清晰流畅、易于辨读。

已有早期用户对Gemini Omni Flash的新功能进行了深度应用。全球营销巨头WPP集团已将其与旗下的WPP Open智能体平台集成,以实现对AI生成内容生产过程的更精细化管控。AI视频平台Invideo公司创意总监Nishant Tahilramani表示,他对该模型的视觉特效能力印象深刻,尤其是其将传统电影制作技术与AI工具结合应用于同一项目的能力。

Nano Banana 2 Lite则主要针对极致生成速度进行了优化。Gerstenhaber表示,该模型最快可在四秒内输出高质量的专业级图像,让创作者能够以接近构思的速度快速迭代创意。

与上一代产品Gemini 2.5 Flash Image相比,Nano Banana 2 Lite在视觉质量方面获得了显著提升。例如,它拥有更丰富的"世界知识"储备,使其在生成本地化视觉内容时更加精准。

举例来说,若用户希望生成一幅苏格兰高地的背景图,Nano Banana 2 Lite能够高度还原该地貌的真实风貌。该模型还支持更出色的角色一致性,适用于分镜脚本等创作任务。

市场初期反馈同样令人振奋。创意资产平台Artlist公司AI内容与创新总监Idan Yonas表示,该模型极快的生成速度意味着内容生成已比构思更快完成,创作者可以始终沉浸在创意本身,而不会因等待进度条而分心走神。

设计平台Figma也是该模型的用户之一,其将Nano Banana 2 Lite整合进Figma Weave画布,以支持更快速的布局迭代。与此同时,Manus AI已将其集成至自主工作流程中,用于快速生成网页与幻灯片中的视觉资产。

Gerstenhaber表示,Nano Banana 2 Lite即日起可通过Gemini企业智能体平台以预置吞吐量方式使用,Gemini Omni Flash也将"很快"正式推出。两款新模型均支持CP2A内容凭证与SynthID水印功能,以保障其所生成媒体内容的真实性与可溯源性。

Q&A

Q1:Gemini Omni Flash的定价是多少?它有哪些核心功能?

A:Gemini Omni Flash的定价为每秒视频输出0.1美元,是目前同类模型中定价最具竞争力的之一。其核心功能包括对话式编辑工具,支持用自然语言指令替换角色、调整镜头角度和重新布光;同时具备视频、文本与图片上传能力,可模仿输入素材风格进行创作;还支持同步音频生成以及文本与动作同步功能,确保画面中的文字清晰可读。

Q2:Nano Banana 2 Lite与上一代Gemini 2.5 Flash Image相比有哪些提升?

A:Nano Banana 2 Lite在视觉质量上相较上一代Gemini 2.5 Flash Image获得了显著升级,主要体现在更丰富的"世界知识"储备上,使其能更准确地生成具有地域特征的本地化视觉内容,例如精准还原苏格兰高地的地貌风格。此外,该模型在角色一致性方面也有所加强,更适合分镜脚本等需要保持人物形象连贯的创作场景,生成速度最快可达四秒。

Q3:Gemini企业智能体平台适合哪些用户使用?

A:Gemini企业智能体平台主要面向希望大规模部署自主AI智能体的企业用户,尤其适合创作者和数字营销人员。该平台提供统一工作环境,支持将视频、图像等媒体工具嵌入智能体工作流程,实现内容的自动化创作与一站式管理,用户无需在多个编辑工具间切换,可直接在平台内完成设计、构建、二次创作与发布全流程。

来源:SiliconANGLE

0赞

好文章,需要你的鼓励

2026

07/01

17:51

分享

点赞

邮件订阅