Google I/O 是谷歌年度最大的开发者大会,即将拉开帷幕。
会议定于 5 月 20 日至 21 日在 Mountain View 的 Shoreline Amphitheatre 举行,届时谷歌将展示其全产品线的新产品发布。大家可以期待关于 Android、Chrome、Google Search、YouTube 以及——当然——谷歌的基于 AI 的聊天机器人 Gemini 的大量新闻。
以下是主要亮点。
AI 是当前的热门技术,和竞争对手一样,谷歌也在这方面投入巨资。
I/O 大会的必然亮点之一是谷歌旗舰 Gemini 系列 AI 模型的新补充(或若干补充)。过去几周的泄露信息显示,一款升级版的 Gemini Ultra 正在路上,而 Gemini Ultra 是谷歌顶级的 Gemini 产品。
随着这一升级版本的推出,可能会推出更高价位的 Gemini 订阅服务。
目前,谷歌仅提供单一的高端订阅级别 Gemini Advanced(每月 ),可解锁其由 Gemini 模型提供支持的聊天机器人更多的功能。但谷歌可能很快会推出两个全新计划:Premium Plus 和 Premium Pro。具体能提供哪些额外功能以及这些计划相对于 Gemini Advanced 的定价方式,目前尚不明确。
谷歌几乎可以肯定会谈及 Astra,这是其旨在构建 AI 应用和“agents”以实现实时、多模态理解的广泛计划。此外,议程上很可能还会包括 Project Mariner,这是谷歌的 AI “agents”,能够在用户的代理下在网络中导航并执行操作。有人在 X 平台上发现了谷歌 AI Studio 开发者平台代码中对 “Computer Use” 的提及,这很可能与 Mariner 计划相关。
今年谷歌首次单独举办一场专门介绍 Android 更新的活动——The Android Show,该活动将在 I/O 前一周左右的星期二举行。
活动重点将是最新版本的 Android——Android 16。预计 Android 16 将带来改进的通知系统和全新设计语言 Material 3 Expressive。在一篇泄露的博客文章中,谷歌将 Material 3 Expressive 描述为一次彻底的革新,具有更高的响应速度和突出“行动要素”。
据报道,Android 16 主要是一项以提升用户体验为目标的质量改进更新。它将支持 Auracast 功能,使在蓝牙设备之间切换更为便捷。除此之外,还将引入锁屏小部件和一系列新的辅助功能。
谷歌还可能重点介绍最新版本的 Android XR(其混合现实操作系统)以及 Wear OS(谷歌为可穿戴设备提供的软件)的相关功能。
根据官方 I/O 日程安排,在 The Android Show 和 I/O 主题演讲之后,谷歌还有大量议题要讨论。
日程中列有专门针对 Chrome 与 Google Cloud、Google Play(Android 应用商店)、Android 开发工具以及 Gemma——谷歌推出的“开放” AI 模型集合——的专题会话。
去年,谷歌在 I/O 上发布了一些 AI 相关的惊喜项目,其中包括一系列针对教育应用进行微调的模型,名为 LearnLM。谷歌广受欢迎的播客生成工具 NotebookLM 的升级版本也可能成为一大亮点。泄露的代码显示了一个 “Video Overviews” 工具,该工具大概率用于创建视频摘要,很可能依托于谷歌的 Veo 2 视频生成模型。
好文章,需要你的鼓励
南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
AWS通过升级SageMaker机器学习平台来扩展市场地位,新增观测能力、连接式编码环境和GPU集群性能管理功能。面对谷歌和微软的激烈竞争,AWS专注于为企业提供AI基础设施支撑。SageMaker新功能包括深入洞察模型性能下降原因、为开发者提供更多计算资源控制权,以及支持本地IDE连接部署。这些更新主要源于客户需求,旨在解决AI模型开发中的实际问题。
MTS AI研究团队提出RewardRanker系统,通过重排序模型和迭代自训练显著提升AI代码生成质量。该方法让13.4B参数模型超越33B大模型,在多种编程语言上表现优异,甚至在C++上超越GPT-4。通过引入困难负样本和PPO优化,系统能从多个代码候选中选出最优方案,为AI编程助手的实用化奠定基础。