Google 上周发布了其最新最强的 Gemini AI 模型,但当时仅向付费订阅用户开放。不过这次 Google 以不同寻常的速度,也为免费用户开放了 Gemini 2.5 Pro (实验版)。下次当你使用 Gemini 时,无需 Gemini Advanced 订阅就能访问这款新 AI 的大部分功能。
Gemini 2.5 分支最终将取代 2024 年底才发布的 2.0 版本。它支持模拟推理功能,这也将是所有 Google 未来模型都具备的特性。这种输出方式可以避免 AI 模型过去常犯的一些错误。我们对 Gemini 2.5 的表现印象深刻,它已经登上了 LMSYS Chatbot 竞技场排行榜的榜首。
Google 表示,免费用户现在就可以在网页版上体验 Gemini 2.5 Pro (实验版)。只需从下拉菜单中选择该模型,输入提示词就能观察它的"思考"过程。该模型很快也将在移动应用端向免费用户开放。
虽然免费版可以使用这个模型,但并不包含所有高级功能。没有付费账户仍然无法向 Gemini 上传文件,这可能会限制用户充分利用模型的大型上下文窗口能力——况且你也无法获得完整的 100 万 token 窗口。Google 表示免费版 Gemini 2.5 Pro (实验版) 会有一个较低的限制,但具体数值尚未公布。我们测试添加了几千字都没有问题,但还是存在其他限制。
这并不是一个完全自由使用的 Gemini 2.5。Google 仍然希望推广付费订阅,所以新模型的使用会受到频率限制。同样,Google 没有明确说明具体限制。我们用免费版 Gemini 总结了一些中等长度的文本,生成了几个基础代码项目后就被限制了。根据你对模型的要求不同,可能几个提示词就会用完免费额度。
Gemini 2.5 Pro 仅让免费用户尝鲜。
作为 Pro 模型,这个版本的 Gemini 运营成本可能要高得多,所以看到严格的使用限制并不意外。当你达到模糊的免费使用限制时,会弹出一个提示框 (包含一个明显的拼写错误),显示限制何时重置;在我们的测试中大约是三小时后。随着推广继续,Google 可能会调整 token 和使用限制,所以个人体验可能会有所不同。
如果你之前对 Gemini 模型印象不佳——这种感受很合理——建议你可以试试 Gemini 2.5 Pro (实验版)。在过去几年追赶 OpenAI 之后,Google 最新的模型可能找到了突破口。考虑到 Google 推出实验版模型的速度如此之快,相信用不了多久,Gemini 2.5 就会被提炼成更小的 Flash 模型,成为日常任务的默认选择。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。