谷歌周二发布了其内部 AI 视频与图像生成器的最新版本——Imagen 3 Lite,据该公司介绍,这一版本相比前代产品速度更快、成本更低。
该模型延迟大幅降低,可在4秒内完成图像生成,非常适合需要快速迭代、批量产出图像的使用场景。每1000张图像的生成成本仅为0.034美元,对于需要大规模草稿创作和内容打磨的用户而言,性价比极高。
此次发布延续了谷歌过去一年多的产品迭代节奏。去年夏天,基于 Gemini 3.1 Flash 的初代 Imagen 3 正式上线;今年2月,Imagen 3 2 发布,引入了更多能力,包括生成更逼真图像的功能。此外,谷歌还提供定位高端的 Imagen 3 Pro,适用于更复杂的专业场景,功能更强但价格也更高。
与 Imagen 3 2 被定位为"通用型主力模型"不同,Imagen 3 Lite 专为高并发、高频次的工作流场景进行了优化。
尽管外界对图像生成模型产出"AI 泛滥内容"的质疑声不断,各大公司仍在持续加码 AI 图像与视频生成工具的投入。谷歌通常将旗下模型定位为辅助广告创意制作的高效工具。
与此同时,好莱坞与 AI 公司之间的合作关系持续深化,尽管这在部分创作者社群和受众中引发了明显不满。谷歌近期与广受好评的独立电影公司 A24 签署了一项7500万美元的合作协议,该合作遭到不少粉丝的强烈批评。
Imagen 3 Lite 目前已通过 Google AI Studio、Gemini API 以及谷歌 Gemini 企业级智能体平台正式上线。谷歌表示,该模型将取代初代 Imagen 3,后者现已被官方定义为"历史遗留模型"。
同日,谷歌还宣布更大范围开放 Veo 3 Flash。该模型最初于今年谷歌 I/O 大会上首次亮相,视频输出费用为每秒0.10美元。此外,谷歌还展示了一款全新演示应用 Veo Product Studio,该应用可将 Veo 生成的静态图像转化为"电影质感的电商视频"。
谷歌在一篇博客中表示:"生成式 AI 的内容创作本质上是一个创意迭代的过程。借助这两款模型,开发者可以构建完整的端到端多媒体体验,将快速图像生成与视频创作、编辑无缝衔接。"
Q&A
Q1:Imagen 3 Lite 的生成速度和价格是怎样的?
A:Imagen 3 Lite 可在4秒内完成一张图像的生成,延迟相比前代产品大幅降低。在价格方面,每1000张图像的生成成本仅为0.034美元,适合需要大规模批量生成图像的用户,性价比较高,尤其适用于广告创意、内容草稿等高频使用场景。
Q2:Imagen 3 Lite 和 Imagen 3 2 有什么区别?
A:Imagen 3 2 被定位为"通用型主力模型",具备生成更逼真图像等多项能力,适合多种通用场景。而 Imagen 3 Lite 则专为高并发、高频次的工作流进行了优化,强调速度快、成本低,更适合需要快速迭代和批量产出的场景。两者定位不同,用户可根据实际需求选择使用。
Q3:Imagen 3 Lite 在哪里可以使用?
A:Imagen 3 Lite 目前已通过 Google AI Studio、Gemini API 以及谷歌 Gemini 企业级智能体平台正式上线,开发者和企业用户均可通过上述渠道接入使用。谷歌表示,Imagen 3 Lite 将作为初代 Imagen 3 的替代产品,后者已被官方标记为"历史遗留模型"。
好文章,需要你的鼓励
超过140家金融、支付及科技公司,包括Visa、Stripe和贝莱德,联合支持推出名为Open USD(OUSD)的新稳定币,直接挑战市场领导者Tether和Circle。OUSD由独立机构Open Standard LLC运营,主打零费用、无限额铸造与赎回,且储备收益大部分归合作伙伴所有,而非由发行方独占。Mastercard、美国运通、谷歌、Shopify、Coinbase等巨头均已加入。Circle股价在消息公布后下跌约13%。
这项研究系统比较了四种AI图像分词策略在640000张星系图像上的表现,发现重建质量与物理属性预测能力之间存在根本性解耦,为天文基础模型的分词器选择提供了实验依据。
Anthropic正式推出中端大语言模型Claude Sonnet 5,其编程能力在SWE-Bench Pro和Terminal-Bench 2.1两项基准测试中分别提升5.1%和13.4%。该模型具备更强自主性,能主动核查输出结果,并在抵御恶意请求和提示注入攻击方面表现更优。Sonnet 5将成为Claude免费版和Pro版的默认模型,定价为每百万输入token 3美元。此外,此前因美国出口管制而暂停推出的Mythos 5和Fable 5模型,管制已解除,将于近期恢复访问。
阿里Qwen团队研究如何将大模型的规模化训练思路迁移到机器人操作领域,通过统一多机器人表示与38100小时数据预训练,让机器人在陌生场景和陌生机型上也能完成复杂操作任务。