据 Google 周二在博客文章中表示,Gemini 2.5 是一个新的 AI 推理模型,旨在与 DeepSeek R1 展开竞争,目前在 LMArena 整体评分中排名最高。
Google 将新一代 Gemini 2.5 模型系列描述为"思考型模型",这类模型会在给出最终结果前递归分析答案。根据 LMArena 的基准测试,Gemini 2.5 在推理、科学、数学和代理编程方面处于领先地位。不过,它并非在所有测试中都胜出。例如,在 LiveCodeBench v5 测试中,OpenAI 的 o3-mini 仍然领先于它。
Gemini 2.5 目前正向付费高级用户推出。有 Reddit 用户报告称,他们需要删除并重新安装 Gemini 应用才能看到 2.5 版本。在桌面端,用户可以在 Google AI Studio 中找到 Gemini 2.5。
Google 的 AI 模型相比竞争对手的一大优势在于其高 token 处理率——即理解或生成复杂数据集的能力。Google 一直宣传 Gemini 是能够处理大上下文窗口并具有高 token 输出的 AI。在社交媒体平台 X (前身为 Twitter) 上,人们也在实验 Gemini 2.5 的能力。Google DeepMind 的员工研究员 Fei Xia 成功地将一个简单的三层蛋糕草图转换成了 3D 打印文件。
Google 展示了一段视频,演示了 Gemini 2.5 如何在几秒钟内制作一个简单的无尽跑酷视频游戏。另一位 X 用户则制作了一个简单的飞行模拟视频游戏。
Google 尚未立即回应置评请求。
Gemini 2.5 的推出是 AI 竞技场中投入的最新武器。今年早些时候,来自中国的 DeepSeek R1 的发布让美国 AI 公司警觉起来。DeepSeek 发布了一个免费开源的推理模型,其效率超过了 OpenAI 现有的产品。
Google 也在 AI 领域押下重注。生成式技术已渗透到公司产品组合的方方面面,从搜索到文档都不例外。Google 计划仅在 2025 年就投资 750 亿美元用于 AI 开发。考虑到根据 Grand View Research 的预测,到 2030 年 AI 市场规模将增长到 1.8 万亿美元,Google 在这个领域占据主导地位具有强大的经济动机。
除了 Gemini 2.5,Google 今年早些时候还推出了旨在提供更快推理能力的 Gemini 2.0 Flash Thinking。上个月,Google 发布了 Gemini Code Assist,这是一个具有大量输入 token 支持的免费 AI 编程工具。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。