Gemini 3.1 Flash-Lite：高性能规模化大语言模型

谷歌推出Gemini 3.1 Flash-Lite，这是Gemini 3系列中速度最快、成本效率最高的模型。定价仅为0.25美元/百万输入tokens，1.50美元/百万输出tokens，相比2.5 Flash实现2.5倍首次响应速度提升和45%输出速度增长。该模型在Arena.ai排行榜获得1432分Elo评分，支持可调节的思考级别，适用于大规模翻译、内容审核等高频任务以及复杂推理场景。

今天，我们正式推出Gemini 3.1 Flash-Lite，这是Gemini 3系列中速度最快、成本效益最高的大语言模型。该模型专为开发者大规模高频次工作负载而构建，在其价格和型号级别上提供了卓越的质量表现。

从今天开始，3.1 Flash-Lite将通过Google AI Studio中的Gemini API向开发者进行预览版推出，企业用户可以通过Vertex AI获取服务。

高性价比无妥协

3.1 Flash-Lite定价极具竞争力，输入Token价格仅为0.25美元每百万Token，输出Token价格为1.50美元每百万Token，以更大型模型的一小部分成本提供了增强的性能。根据Artificial Analysis基准测试，该模型在保持类似或更好质量的同时，相比2.5 Flash模型，首Token响应速度提升2.5倍，输出速度提升45%。这种低延迟对于高频工作流程至关重要，使其成为开发者构建响应迅速、实时体验的理想模型。

在性能方面，3.1 Flash-Lite在Arena.ai排行榜上取得了令人瞩目的1432分Elo评分，在推理和多模态理解基准测试中超越了同等级别的其他模型，在GPQA Diamond上达到86.9%，在MMMU Pro上达到76.8%，甚至超过了上一代较大的Gemini模型如2.5 Flash。

开发者规模化自适应智能

除了原始性能表现外，Gemini 3.1 Flash-Lite在AI Studio和Vertex AI中标配了思维层级功能，让开发者能够控制和灵活选择模型对任务的"思考"深度，这对于管理高频工作负载至关重要。3.1 Flash-Lite能够处理大规模任务，如成本优先的大批量翻译和内容审核。同时，它也能处理需要更深入推理的复杂工作负载，如生成用户界面和仪表板、创建模拟或执行指令。

在实际应用中，3.1 Flash-Lite能够即时为电商线框图填充数百种不同类别的产品信息。它可以利用实时预报和历史数据生成动态天气仪表板。该模型还能创建具备多步骤任务执行能力的SaaS智能体，为企业提供多样化服务。此外，它能够快速分析和分类大量内容，包括图像处理。

AI Studio和Vertex AI的早期访问开发者，以及Latitude、Cartwheel和Whering等公司，已经开始使用3.1 Flash-Lite大规模解决复杂问题。早期测试者强调了3.1 Flash-Lite的效率和推理能力，称它能够以更大型模型的精度处理复杂输入，同时具备出色的指令遵循能力和一致性保持。

我们期待看到您使用3.1 Flash-Lite和Gemini 3系列其他模型构建的精彩应用。

Q&A

Q1：Gemini 3.1 Flash-Lite相比之前的模型有什么优势？

A：Gemini 3.1 Flash-Lite在速度和成本效益方面表现突出。相比2.5 Flash模型，它的首Token响应速度提升2.5倍，输出速度提升45%，同时价格更低廉，仅需0.25美元/百万输入Token和1.50美元/百万输出Token。

Q2：Gemini 3.1 Flash-Lite适合哪些应用场景？

A：该模型特别适合高频次、大规模的工作负载，如批量翻译、内容审核等成本敏感任务。同时也能处理复杂推理任务，如生成用户界面、创建仪表板、执行多步骤指令和图像分析等。

Q3：开发者如何获取Gemini 3.1 Flash-Lite？

A：开发者可以通过Google AI Studio中的Gemini API访问3.1 Flash-Lite的预览版，企业用户则可以通过Vertex AI平台获取服务。该模型还配备了思维层级功能，让开发者能够灵活控制模型的思考深度。

来源：Google DeepMind

0赞

好文章，需要你的鼓励

Gemini 3.1 Flash-Lite：高性能规模化大语言模型

来源：Google DeepMind

2026

03/04

14:55

分享

点赞

Vint Cerf离开谷歌后，正着手推动AI智能体进入开放互联网

语音AI初创公司Rime完成2400万美元A轮融资

Anthropic与黑石押注AI落地实施将成下一个万亿美元赛道

Senra融资6500万美元，以现代化技术革新线束制造

AGI融资7000万美元，收购保险公司并将其改造为AI原生运营

Creatio推出对话式开发工具与AI Studio，打破无代码平台边界

Emergent Labs完成1.3亿美元C轮融资，成为最新AI独角兽

量子计算融入数据中心：混合架构时代正式开启

苹果起诉OpenAI：AI竞争新战场正转向人才争夺

OpenAI首款消费设备曝光：便携式智能音箱即将亮相

波多黎各用清洁氢能升级偏远微电网，提升灾后供电韧性

Whatnot收购AI推荐公司Shaped，强化直播购物实时个性化能力

苹果发布搭载全新M5 Pro和M5 Max芯片的MacBook Pro

构建高效一线团队：首席信息安全官必须遵循的3个步骤

谷歌MWC 2026展台全新体验：智能眼镜、AI试衣和可爱机器人

AWS支持Open VSX注册中心，Rust调查显示VS Code使用率下降

重构供应链打造弹性体系应对外部挑战

苹果或将使用谷歌服务器存储升级版AI Siri数据

实体AI应用提升客户服务投资回报率

科技巨头利用AI农业工具"操控粮食系统"引发专家警告

Krisp推出实时口音转换技术，仅在听者端进行处理

TerraStackAI：为红帽和全球带来地球与空间AI技术

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: