Google今天发布了基于上月推出的Gemini 3的快速且经济的Gemini 3 Flash模型,试图抢夺OpenAI的风头。该公司还将此模型设为Gemini应用和搜索AI模式中的默认模型。
新的Flash模型在Google宣布Gemini 2.5 Flash模型六个月后到来,提供了显著改进。在基准测试中,Gemini 3 Flash模型大幅超越其前代产品,并在某些指标上与其他前沿模型(如Gemini 3 Pro和GPT 5.2)的性能持平。
例如,它在Humanity's Last Exam基准测试中未使用工具的情况下获得了33.7%的分数,该测试旨在测试不同领域的专业知识。相比之下,Gemini 3 Pro得分37.5%,Gemini 2.5 Flash得分11%,新发布的GPT-5.2得分34.5%。
在多模态和推理基准测试MMMU-Pro中,新模型以81.2%的得分超越了所有竞争对手。
面向消费者的推广
Google正在全球范围内将Gemini 3 Flash设为Gemini应用中的默认模型,取代Gemini 2.5 Flash。用户仍可从模型选择器中选择Pro模型来处理数学和编程问题。
该公司表示,新模型擅长识别多模态内容并基于此给出答案。例如,您可以上传您的匹克球短视频并寻求技巧;您可以尝试画草图,让模型猜测您在画什么;或者您可以上传音频记录以获得分析或生成测验。
该公司还表示,该模型能更好地理解用户查询的意图,并能生成包含图像和表格等元素的更具视觉效果的答案。
您还可以在Gemini应用中使用新模型通过提示创建应用原型。
Gemini 3 Pro现已面向美国所有用户开放用于搜索,更多美国用户也可以在搜索中访问Nano Banana Pro图像模型。
企业和开发者可用性
Google指出,JetBrains、Figma、Cursor、Harvey和Latitude等公司已在使用Gemini 3 Flash模型,该模型可通过Vertex AI和Gemini Enterprise获得。
对于开发者,该公司正通过API以预览模型形式提供该模型,并在Google上月发布的新编码工具Antigravity中提供。
该公司表示,Gemini 3 Pro在SWE-bench验证编码基准测试中得分78%,仅次于GPT-5.2。它补充说,该模型非常适合视频分析、数据提取和视觉问答,由于其速度优势,适合快速且可重复的工作流程。
模型定价为每100万输入Token 0.50美元,每100万输出Token 3.00美元。这比Gemini Flash 2.5的每100万输入Token 0.30美元和每100万输出Token 2.50美元略贵。但Google声称,新模型的性能超越Gemini 2.5 Pro模型,同时速度快三倍。而且,对于思考任务,它平均使用的Token比2.5 Pro少30%。这意味着总体而言,您可能会在某些任务上节省Token数量。
Gemini模型产品主管兼高级总监Tulsee Doshi在向TechCrunch的简报会上表示:"我们将Flash定位为更实用的工作马模型。例如,即使从这个表格顶部的输入和输出价格来看,Flash从输入和输出价格角度来说都是更便宜的选择。因此,它实际上允许许多公司处理批量任务。"
自发布Gemini 3以来,在与OpenAI激烈的发布和性能竞争中,Google每天通过其API处理超过1万亿个Token。
本月早些时候,据报道,在ChatGPT的流量下降而Google在消费者市场份额上升后,Sam Altman向OpenAI团队发送了一份内部"红色警报"备忘录。此后,OpenAI发布了GPT-5.2和新的图像生成模型。OpenAI还宣传其不断增长的企业使用情况,并表示自2024年11月以来,ChatGPT消息量增长了8倍。
虽然Google没有直接谈及与OpenAI的竞争,但它表示,新模型的发布正在挑战所有公司保持活跃。
Doshi说:"整个行业正在发生的情况是,所有这些模型都在不断变得更强大,相互挑战,推动前沿发展。我认为同样令人兴奋的是,随着公司发布这些模型,我们也在引入新的基准测试和评估这些模型的新方法。这也在鼓励我们。"
Q&A
Q1:Gemini 3 Flash有什么特别之处?
A:Gemini 3 Flash是Google最新发布的快速且经济的AI模型,它在性能上大幅超越前代产品Gemini 2.5 Flash,在某些指标上与Gemini 3 Pro和GPT 5.2等前沿模型性能相当。它擅长识别多模态内容,能处理视频、图像、音频等多种输入,并生成包含图像和表格的可视化答案。
Q2:Gemini 3 Flash的价格是多少?
A:Gemini 3 Flash的定价为每100万输入Token 0.50美元,每100万输出Token 3.00美元。虽然比Gemini 2.5 Flash略贵,但它的性能超越Gemini 2.5 Pro,速度快三倍,且在思考任务中平均使用的Token比2.5 Pro少30%,总体上可能为某些任务节省成本。
Q3:普通用户如何使用Gemini 3 Flash?
A:Google已将Gemini 3 Flash设为Gemini应用中的全球默认模型,用户可以直接使用。用户可以上传视频寻求建议、画草图让模型猜测、上传音频获得分析或生成测验,还可以使用提示创建应用原型。如需处理数学和编程等复杂问题,用户仍可选择Pro模型。
好文章,需要你的鼓励
据报道,OpenAI正与亚马逊洽谈至少100亿美元的融资。亚马逊此前已是Anthropic的最大投资者,并为其建设了110亿美元的数据中心园区。若融资达成,OpenAI将采用AWS的Trainium系列AI芯片。Trainium3采用三纳米工艺,配备八核心和32MB SRAM内存。AWS可将数千台服务器连接成拥有百万芯片的集群。报道未透露具体估值,但OpenAI最近一次二次出售估值已达5000亿美元。
伊斯法罕大学研究团队通过分析Google Play商店21款AI教育应用的用户评论,发现作业辅导类应用获得超80%正面评价,而语言学习和管理系统类应用表现较差。用户赞赏AI工具的快速响应和个性化指导,但抱怨收费过高、准确性不稳定等问题。研究建议开发者关注自适应个性化,政策制定者建立相关规范,未来发展方向为混合AI-人类模型。
各行业企业存储的数据量持续攀升,5PB以上已成常态,10PB以上也日益普遍。2026年非结构化数据管理的主题是全面增长:更多数据、更多投资、更多痛点以及更多AI安全风险。AI应用加速普及、数字化信息激增以及富媒体和传感器数据大幅增加推动了数据增长。随着AI推理应用的发展,企业将意识到非结构化数据管理对AI投资回报率的关键作用。
这项由伊利诺伊大学香槟分校等四所院校联合完成的研究,提出了名为DaSH的层次化数据选择方法。该方法突破了传统数据选择只关注单个样本的局限,通过建模数据的天然层次结构,实现了更智能高效的数据集选择。在两个公开基准测试中,DaSH相比现有方法提升了高达26.2%的准确率,同时大幅减少了所需的探索步数。