据 Google 周二在博客文章中表示,Gemini 2.5 是一个新的 AI 推理模型,旨在与 DeepSeek R1 展开竞争,目前在 LMArena 整体评分中排名最高。
Google 将新一代 Gemini 2.5 模型系列描述为"思考型模型",这类模型会在给出最终结果前递归分析答案。根据 LMArena 的基准测试,Gemini 2.5 在推理、科学、数学和代理编程方面处于领先地位。不过,它并非在所有测试中都胜出。例如,在 LiveCodeBench v5 测试中,OpenAI 的 o3-mini 仍然领先于它。
Gemini 2.5 目前正向付费高级用户推出。有 Reddit 用户报告称,他们需要删除并重新安装 Gemini 应用才能看到 2.5 版本。在桌面端,用户可以在 Google AI Studio 中找到 Gemini 2.5。
Google 的 AI 模型相比竞争对手的一大优势在于其高 token 处理率——即理解或生成复杂数据集的能力。Google 一直宣传 Gemini 是能够处理大上下文窗口并具有高 token 输出的 AI。在社交媒体平台 X (前身为 Twitter) 上,人们也在实验 Gemini 2.5 的能力。Google DeepMind 的员工研究员 Fei Xia 成功地将一个简单的三层蛋糕草图转换成了 3D 打印文件。
Google 展示了一段视频,演示了 Gemini 2.5 如何在几秒钟内制作一个简单的无尽跑酷视频游戏。另一位 X 用户则制作了一个简单的飞行模拟视频游戏。
Google 尚未立即回应置评请求。
Gemini 2.5 的推出是 AI 竞技场中投入的最新武器。今年早些时候,来自中国的 DeepSeek R1 的发布让美国 AI 公司警觉起来。DeepSeek 发布了一个免费开源的推理模型,其效率超过了 OpenAI 现有的产品。
Google 也在 AI 领域押下重注。生成式技术已渗透到公司产品组合的方方面面,从搜索到文档都不例外。Google 计划仅在 2025 年就投资 750 亿美元用于 AI 开发。考虑到根据 Grand View Research 的预测,到 2030 年 AI 市场规模将增长到 1.8 万亿美元,Google 在这个领域占据主导地位具有强大的经济动机。
除了 Gemini 2.5,Google 今年早些时候还推出了旨在提供更快推理能力的 Gemini 2.0 Flash Thinking。上个月,Google 发布了 Gemini Code Assist,这是一个具有大量输入 token 支持的免费 AI 编程工具。
好文章,需要你的鼓励
阿里巴巴推出全新 Qwen3 系列人工智能模型,采用混合专家技术在编码、数学和推理测试中超越部分美国顶级模型,支持119种语言,助力实现超越人类智慧的通用人工智能目标。
OpenAI更新ChatGPT搜索功能,新增购物体验,提供产品推荐与直购链接,力图挑战Google购物服务。
这篇文章介绍了 14 款在心理健康领域具有创新性的生成式 AI 工具,涵盖正念应用、聊天机器人、个性化疗法助手以及 AI 驱动的日记记录。虽然 AI 还无法完全替代专业治疗师的人性关怀,但这些平台正在为更广泛人群提供便捷、匿名的支持和指导,推动数字心理健康护理的普及与革新。
Nvidia 推出基于 BlueField 处理单元的 DOCA Argus 框架,实现对 AI 工作负载的无代理实时威胁检测,并与 Cisco 合作,为 AI 基础设施提供全方位安全防护。