今天,我们正式推出Gemini 3.1 Flash-Lite,这是Gemini 3系列中速度最快、成本效益最高的大语言模型。该模型专为开发者大规模高频次工作负载而构建,在其价格和型号级别上提供了卓越的质量表现。
从今天开始,3.1 Flash-Lite将通过Google AI Studio中的Gemini API向开发者进行预览版推出,企业用户可以通过Vertex AI获取服务。
高性价比无妥协
3.1 Flash-Lite定价极具竞争力,输入Token价格仅为0.25美元每百万Token,输出Token价格为1.50美元每百万Token,以更大型模型的一小部分成本提供了增强的性能。根据Artificial Analysis基准测试,该模型在保持类似或更好质量的同时,相比2.5 Flash模型,首Token响应速度提升2.5倍,输出速度提升45%。这种低延迟对于高频工作流程至关重要,使其成为开发者构建响应迅速、实时体验的理想模型。
在性能方面,3.1 Flash-Lite在Arena.ai排行榜上取得了令人瞩目的1432分Elo评分,在推理和多模态理解基准测试中超越了同等级别的其他模型,在GPQA Diamond上达到86.9%,在MMMU Pro上达到76.8%,甚至超过了上一代较大的Gemini模型如2.5 Flash。
开发者规模化自适应智能
除了原始性能表现外,Gemini 3.1 Flash-Lite在AI Studio和Vertex AI中标配了思维层级功能,让开发者能够控制和灵活选择模型对任务的"思考"深度,这对于管理高频工作负载至关重要。3.1 Flash-Lite能够处理大规模任务,如成本优先的大批量翻译和内容审核。同时,它也能处理需要更深入推理的复杂工作负载,如生成用户界面和仪表板、创建模拟或执行指令。
在实际应用中,3.1 Flash-Lite能够即时为电商线框图填充数百种不同类别的产品信息。它可以利用实时预报和历史数据生成动态天气仪表板。该模型还能创建具备多步骤任务执行能力的SaaS智能体,为企业提供多样化服务。此外,它能够快速分析和分类大量内容,包括图像处理。
AI Studio和Vertex AI的早期访问开发者,以及Latitude、Cartwheel和Whering等公司,已经开始使用3.1 Flash-Lite大规模解决复杂问题。早期测试者强调了3.1 Flash-Lite的效率和推理能力,称它能够以更大型模型的精度处理复杂输入,同时具备出色的指令遵循能力和一致性保持。
我们期待看到您使用3.1 Flash-Lite和Gemini 3系列其他模型构建的精彩应用。
Q&A
Q1:Gemini 3.1 Flash-Lite相比之前的模型有什么优势?
A:Gemini 3.1 Flash-Lite在速度和成本效益方面表现突出。相比2.5 Flash模型,它的首Token响应速度提升2.5倍,输出速度提升45%,同时价格更低廉,仅需0.25美元/百万输入Token和1.50美元/百万输出Token。
Q2:Gemini 3.1 Flash-Lite适合哪些应用场景?
A:该模型特别适合高频次、大规模的工作负载,如批量翻译、内容审核等成本敏感任务。同时也能处理复杂推理任务,如生成用户界面、创建仪表板、执行多步骤指令和图像分析等。
Q3:开发者如何获取Gemini 3.1 Flash-Lite?
A:开发者可以通过Google AI Studio中的Gemini API访问3.1 Flash-Lite的预览版,企业用户则可以通过Vertex AI平台获取服务。该模型还配备了思维层级功能,让开发者能够灵活控制模型的思考深度。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。