如今AI图像生成模型层出不穷,但能够输出高质量图像的模型往往速度慢、成本高。Google DeepMind表示,其全新图像模型Gemini 3.1 Flash Lite Image在质量与速度之间实现了最佳平衡,现已正式上线并接入整个Google生态系统,生成图像的速度仅需同系列旗舰模型所用时间的一小部分。
该模型是Gemini 3.1系列的成员之一。Google表示,这款模型非常适合创意探索与"快速迭代"原型开发等对图像质量要求相对宽松的应用场景。与此同时,Google也提供了一批示例图像,旨在展示Gemini 3.1 Flash Lite Image的输出质量与同系列非Lite版本的接近程度。
除示例图像外,Google还引用了来自Arena.ai的Elo评分数据,结果显示用户对Gemini 3.1 Flash Lite Image输出的评价几乎与非Lite版本不相上下。不过,此类主观评测有时并不聚焦于那些在近距离审视时会让AI图像显得不自然的细节。Google坦承,Gemini 3.1 Flash Lite Image在处理文字方面表现较弱,尤其是字号较小的文本;信息图表中更容易出现数据错误;人物与角色在多次生成时也可能存在形象不一致的问题。
不过,这款模型的速度确实出色。在默认低思考模式下,从文字描述到图像输出仅需约4秒,而使用标准版Gemini Flash生成同样的图像则需要约20秒。速度与效率上的优势也直接体现在API调用成本上——Google表示,该模型每1000张图像的平均费用约为0.034美元,API计费标准为每100万输入Token 0.25美元、每100万输出Token 1.50美元,仅为Gemini 2 Flash版本的一半。相比之下,Gemini Flash Pro的输入Token价格相差不大,为每100万2美元,但输出Token高达每100万12美元,是Lite版本的八倍。
对于只是偶尔生成单张图像的用户,选择Flash或Pro版本可能更为合适,因为它们在文字处理和写实风格图像的准确性上表现更好。但若需要快速迭代方案或寻找设计灵感,Gemini 3.1 Flash Lite Image则能有效节省时间与成本。
Gemini 3.1 Flash Lite Image的高速特性也意味着网络上可能出现更多AI生成内容。尽管提供低成本图像生成服务的并非只有Google一家,但Gemini 3.1 Flash Lite Image在同类低成本选项中的质量表现似乎更胜一筹。Google表示,该模型生成的所有图像均内嵌SynthID水印,理论上即便经过后期编辑,仍可识别其AI生成属性。
目前,用户可在Google AI Studio中体验Gemini 3.1 Flash Lite Image,API接口已同步开放。此外,用户也可在Gemini中选择Flash-Lite选项并请求生成图像。Google还表示,将进一步扩大Gemini Omni Flash的使用范围——该功能于今年5月I/O大会上发布,目前仍主要聚焦于视频生成,现已向Gemini API和Google AI Studio开放,此前已在Gemini应用及Google Flow中上线。
Q&A
Q1:Gemini 3.1 Flash Lite Image和普通版Flash有什么区别?
A:Gemini 3.1 Flash Lite Image是Google专为快速迭代和低成本场景设计的轻量级图像模型。与标准Flash版相比,Lite版生成速度更快,约4秒即可出图,而标准版需约20秒;API成本也更低,输出Token价格为每100万1.50美元,是标准版的一半。但在文字渲染、信息图表准确性和人物一致性方面,Lite版表现相对逊色。
Q2:Gemini 3.1 Flash Lite Image的API调用费用是多少?
A:根据Google公布的数据,Gemini 3.1 Flash Lite Image的API计费标准为每100万输入Token 0.25美元,每100万输出Token 1.50美元,平均每生成1000张图像约需0.034美元。相比之下,Gemini 2 Flash版本的价格是Lite版的两倍,而Gemini Flash Pro的输出Token价格则高达每100万12美元,是Lite版的八倍。
Q3:Gemini 3.1 Flash Lite Image生成的图像有没有AI标识?
A:有。Google表示,所有通过Gemini 3.1 Flash Lite Image生成的图像均内嵌了SynthID数字水印。这种水印理论上在图像经过编辑后依然有效,能够标识其AI生成来源,有助于在传播过程中对AI内容进行识别和追溯。
好文章,需要你的鼓励
在2026年爱迪生电气协会年会上,共和党籍佐治亚州长肯普与民主党籍亚利桑那州长霍布斯罕见达成共识:数据中心带来的电网扩容成本不应转嫁给普通居民。两位州长均支持"增长自付"原则,并倡导多元化能源组合。肯普强调核电与冻结居民电费,霍布斯则推动取消数据中心税收豁免并征收水费。两人跨越党派分歧的一致立场,折射出美国电力行业应对数据中心爆发式增长的主流方向。
这项研究系统比较了四种AI图像分词策略在640000张星系图像上的表现,发现重建质量与物理属性预测能力之间存在根本性解耦,为天文基础模型的分词器选择提供了实验依据。
北美电网今夏首次无高风险区域,NERC评估显示58GW新增资源使各地储备充足。然而业内专家普遍警告,这不过是暂时喘息:数据中心并网延迟、太阳能与储能主导新增供应、劳动力短缺、融资困难及气候依赖性上升等问题依然严峻。预计未来两三年内,延迟的数据中心负荷将集中上线,电力系统将面临更大压力,并购整合浪潮也在加速重塑行业格局。
阿里Qwen团队研究如何将大模型的规模化训练思路迁移到机器人操作领域,通过统一多机器人表示与38100小时数据预训练,让机器人在陌生场景和陌生机型上也能完成复杂操作任务。