Google发布Gemini 2.5 Deep Think仅供AI Ultra订阅用户使用

谷歌正式推出其最强大的Gemini 2.5深度思考AI模型，但仅向每月250美元的AI Ultra订阅用户开放。该模型基于Gemini 2.5 Pro，通过增加"思考时间"和并行分析来处理复杂查询。深度思考模型在多个基准测试中表现优异，在人类最终考试中得分34.8%，远超其他模型的20-25%。该模型特别擅长数学推理、科学分析和编程，响应时间需要数分钟，每日使用次数有限制。

Google今天发布了其最强大的Gemini模型，但普通用户可能无法体验。在去年5月I/O大会上首次亮相Gemini 2.5 Deep Think后，Google正式在Gemini应用中推出这一AI功能。Deep Think专为处理最复杂的查询而设计，这意味着它需要消耗比其他模型更多的计算资源。因此，只有订阅Google价值250美元AI Ultra计划的用户才能使用这项功能。

Deep Think基于与Gemini 2.5 Pro相同的基础架构，但通过更大规模的并行分析增加了"思考时间"。据Google介绍，Deep Think会探索解决问题的多种方法，甚至会重新审视和重组它生成的各种假设。这一过程帮助它产出更高质量的答案。

与其他重量级Gemini工具类似，Deep Think需要几分钟时间才能给出答案。这显然让AI在设计美学、科学推理和编程方面更加出色。Google已经用常规基准测试对Deep Think进行了评估，结果显示它超越了标准的Gemini 2.5 Pro以及OpenAI o3和Grok 4等竞争模型。Deep Think在"人类最后考试"基准测试中表现尤其突出，这是一个包含2500个复杂多模态问题的测试集，涵盖100多个学科。其他模型的得分最高只达到20%或25%，而Gemini 2.5 Deep Think取得了34.8%的成绩。

数学是Deep Think的一个重要专长领域，它在AIME基准测试中也展现了强劲表现。不过，这方面仍有改进空间。Google最近透露，它使用了经过特殊训练的Deep Think版本参加国际数学奥林匹克竞赛（IMO），这个版本可以持续思考数小时才给出解决方案。该模型首次赢得了IMO金牌。Google目前只将IMO版本的Deep Think分发给可信测试人员，但希望稍后更广泛地发布。与此同时，标准版Deep Think在2025年IMO测试中仍能达到铜牌水平。

Google AI Ultra订阅用户从今天开始可以在Gemini应用和网页界面中使用Deep Think，但它不会出现在主模型菜单中。当用户选择Gemini 2.5 Pro时，可以将其作为工具访问（与Deep Research、Canvas等功能并列）。即使拥有Google昂贵的AI订阅服务，Google表示每天使用Deep Think查询的次数仍有限制。公司并未明确具体限制数量，也不提供详细信息，暗示这一限制会随时间调整。Deep Think最终将通过API开放，为开发者提供付费服务方式来获得更多提示功能。

Q&A

Q1：Gemini 2.5 Deep Think与普通版本有什么区别？

A：Deep Think基于Gemini 2.5 Pro架构，但通过更大规模的并行分析增加了"思考时间"。它会探索解决问题的多种方法，重新审视和重组生成的假设，产出更高质量的答案，但需要几分钟才能给出回应。

Q2：哪些用户可以使用Gemini 2.5 Deep Think？

A：目前只有订阅Google价值250美元AI Ultra计划的用户才能使用Deep Think功能。即使是付费用户，每天使用Deep Think查询的次数也有限制，具体数量Google未公开。

Q3：Gemini 2.5 Deep Think在数学方面表现如何？

A：Deep Think在数学领域表现出色，在AIME基准测试中有强劲表现。特殊训练版本甚至首次赢得了国际数学奥林匹克竞赛金牌，标准版本也能在2025年IMO测试中达到铜牌水平。

来源：Arstechnica

0赞

好文章，需要你的鼓励

Google发布Gemini 2.5 Deep Think仅供AI Ultra订阅用户使用

来源：Arstechnica

2025

08/04

10:35

分享

点赞

特斯拉疑似删除FSD证据，卡特彼勒加速电动化布局，高压系统技术培训刻不容缓

智能体网络流量首超真人访问，"死亡互联网"理论引发新争议

Mentium Technologies Luna-R1 AI芯片入选ET-01星座任务，完成多星部署里程碑

汤道生×姚顺雨：腾讯AI下半场，拼的是“模型×产品”系统能力

AI驱动网络犯罪数量飙升，勒索软件受害者年增389%：Fortinet 发布2026年全球威胁态势研究报告

Inbolt将在Automate展会发布视觉驱动机器人编程新功能

笔记本电脑深度清洁指南：内外兼修焕然一新

加利福尼亚州城市通过全美首个由选民投票决定的数据中心禁令

柴油替代方案：AI数据中心如何利用燃气引擎与蒸汽涡轮供电

AI定义汽车时代，车载以太网可靠性面临全新挑战

安全算法的持续更新正变得愈发困难

轨道数据中心本质上是功能强化的卫星

Anthropic切断OpenAI访问Claude模型的权限

AI时代为何迫使整个计算基础架构重新设计

OpenAI智能体背后的推理技术研发历程

Reddit凭借人类原创内容在AI时代获得新机遇

雀巢如何用数字孪生和AI重塑创意营销未来

Cohere发布企业级视觉模型Command A Vision

Deep Cogito发布四款开源混合推理大语言模型，具备自我改进"直觉"能力

Google DeepMind发布高精度地球AI模型AlphaEarth

这11种情况下千万别用ChatGPT

ServiceNow瞄准"数据地狱"，布局商业智能领域

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: