谷歌发布高速Gemini 3.1 Flash-Lite模型预览版

谷歌推出新款多模态AI模型Gemini 3.1 Flash-Lite，专注成本效益优化。该模型定价仅为每百万输入token 0.25美元，比旗舰版Gemini 3.1 Pro便宜8倍。性能测试显示其响应速度比Gemini 2.5 Flash快45%，首次输出等待时间缩短2.5倍。模型可处理100万token的多模态提示，在11项基准测试中有6项超越GPT-5 mini和Claude 4.5 Haiku，适用于电商翻译、内容审核等高频场景。

谷歌公司今天发布了Gemini 3.1 Flash-Lite，这是其Gemini系列多模态人工智能模型的最新成员。

公司工程师在开发这一算法时特别考虑了成本效率。谷歌最强大的Gemini 3.1 Pro模型起价为每百万输入Token 2美元，每百万输出Token 18美元。对于高要求的工作负载，这些费率还会显著增加。而Gemini 3.1 Flash-Lite的定价为每百万输入Token 0.25美元，生成百万输出Token的成本为1.50美元。

谷歌表示，该算法比其他Gemini模型更快。在内部测试中，公司将其与Gemini 2.5 Flash进行了比较，后者是一个同样针对成本效率优化的早期AI模型。Gemini 3.1 Flash-Lite的整体回答生成速度提高了45%，而用户等待首个输出Token的时间缩短了2.5倍。

该模型可以处理包含多达100万Token数据的多模态提示。它能生成多达64000Token的文本回复。这些文本可以包含软件代码，使Gemini 3.1 Flash-Lite能够生成基于代码的可视化资产，如商业智能仪表板。

谷歌进行了11项基准测试来评估该模型的输出质量。Gemini 3.1 Flash-Lite在其中6项测试中获得最高分，超越了GPT-5 mini和Anthropic公司的Claude 4.5 Haiku。该模型完成得更准确的基准测试之一是GPAQ Diamond，其中包含近200个博士级科学问题。

该模型在HLA（世界最困难的AI基准测试之一）中获得了16%的分数。谷歌顶级的Gemini 3.1 Pro得分为44.4%。

公司预期开发者将Gemini 3.1 Flash-Lite用于不需要广泛推理能力的大量任务。例如，电商市场运营商可以使用它来翻译第三方产品列表并屏蔽违反服务条款的商品。

该模型还适用于其他某些任务。谷歌发布的演示视频显示，一名开发者使用Gemini 3.1 Flash-Lite通过自然语言提示生成了天气跟踪仪表板。在另一个演示中，该模型为电商网站原型添加了数百个说明性产品列表。

这个新模型基于Gemini 3 Pro，后者直到最近还是谷歌的旗舰推理模型。该算法采用混合专家架构，这意味着它只激活部分参数来回答提示。这种方法有助于降低推理成本。

Gemini 3.1 Flash-Lite目前通过谷歌云的Vertex AI服务套件提供预览版。它也可以通过Google AI Studio代码生成工具访问，该工具使开发者能够使用自然语言提示构建简单应用程序。

Q&A

Q1：Gemini 3.1 Flash-Lite相比其他模型有什么优势？

A：Gemini 3.1 Flash-Lite主要有两大优势：成本更低和速度更快。在价格方面，它每百万输入Token仅需0.25美元，输出Token成本1.50美元，远低于Gemini 3.1 Pro的2美元和18美元。在速度方面，相比Gemini 2.5 Flash，整体回答生成速度提高了45%，用户等待首个输出的时间缩短了2.5倍。

Q2：Gemini 3.1 Flash-Lite适合什么样的应用场景？

A：该模型主要适合不需要广泛推理能力的大量处理任务。典型应用场景包括电商平台的第三方产品列表翻译、违规内容检测、生成商业智能仪表板、批量创建产品列表等。它特别适合需要快速、大量处理但对复杂推理要求不高的场景。

Q3：如何获取和使用Gemini 3.1 Flash-Lite？

A：目前Gemini 3.1 Flash-Lite处于预览阶段，可以通过两种方式访问：一是通过谷歌云的Vertex AI服务套件，二是通过Google AI Studio代码生成工具。开发者可以使用自然语言提示来构建简单应用程序，该模型支持处理多达100万Token的多模态输入。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

谷歌发布高速Gemini 3.1 Flash-Lite模型预览版

来源：SiliconANGLE

2026

03/04

12:15

分享

点赞

WAIC 2026主论坛（下午场）重磅揭晓！

AI评测初创公司Braintrust遭入侵，敦促所有客户轮换API密钥

牙科诊所软件漏洞修复：患者医疗记录曾遭泄露

关键基础设施巨头Itron确认遭遇网络攻击

Vercel数据泄露范围扩大，黑客早于已知时间节点已入侵

苹果与博通签署300亿美元协议，共同生产美国本土无线芯片

摩托罗拉领投BRINC 1.25亿美元，推动紧急救援无人机大规模扩张

AI赋能芯片设计：前景广阔，疑问犹存

Arm今夏将推出自研芯片，Meta成首批客户

Cellebrite携手SkySafe，打造无人机数字取证一体化平台

人类意识研究者：对AI可能有意识的说法持怀疑态度

帮助AI模型走向现实世界的企业预测决策技术

阿里巴巴Qwen技术负责人在重大AI突破后离职

Inception发布Mercury 2，快速突破大语言模型延迟瓶颈

iPad Air vs. iPad及iPad Pro对比：如何选择合适的平板电脑

OpenAI在AWS推出有状态AI，预示控制平面权力转移

AI智能体：下一波身份暗物质挑战

Meta智能眼镜被曝向人工审核员分享隐私视频

大语言模型能大规模识别匿名用户身份，准确度令人震惊

新兴市场优先考虑用智能体AI推动营收增长

英国议会启动教育技术应用调查研究

桑坦德银行与万事达卡完成欧洲首个AI自主执行支付试点

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: