Google I/O 是谷歌年度最大的开发者大会,即将拉开帷幕。
会议定于 5 月 20 日至 21 日在 Mountain View 的 Shoreline Amphitheatre 举行,届时谷歌将展示其全产品线的新产品发布。大家可以期待关于 Android、Chrome、Google Search、YouTube 以及——当然——谷歌的基于 AI 的聊天机器人 Gemini 的大量新闻。
以下是主要亮点。
AI 是当前的热门技术,和竞争对手一样,谷歌也在这方面投入巨资。
I/O 大会的必然亮点之一是谷歌旗舰 Gemini 系列 AI 模型的新补充(或若干补充)。过去几周的泄露信息显示,一款升级版的 Gemini Ultra 正在路上,而 Gemini Ultra 是谷歌顶级的 Gemini 产品。
随着这一升级版本的推出,可能会推出更高价位的 Gemini 订阅服务。
目前,谷歌仅提供单一的高端订阅级别 Gemini Advanced(每月 ),可解锁其由 Gemini 模型提供支持的聊天机器人更多的功能。但谷歌可能很快会推出两个全新计划:Premium Plus 和 Premium Pro。具体能提供哪些额外功能以及这些计划相对于 Gemini Advanced 的定价方式,目前尚不明确。
谷歌几乎可以肯定会谈及 Astra,这是其旨在构建 AI 应用和“agents”以实现实时、多模态理解的广泛计划。此外,议程上很可能还会包括 Project Mariner,这是谷歌的 AI “agents”,能够在用户的代理下在网络中导航并执行操作。有人在 X 平台上发现了谷歌 AI Studio 开发者平台代码中对 “Computer Use” 的提及,这很可能与 Mariner 计划相关。
今年谷歌首次单独举办一场专门介绍 Android 更新的活动——The Android Show,该活动将在 I/O 前一周左右的星期二举行。
活动重点将是最新版本的 Android——Android 16。预计 Android 16 将带来改进的通知系统和全新设计语言 Material 3 Expressive。在一篇泄露的博客文章中,谷歌将 Material 3 Expressive 描述为一次彻底的革新,具有更高的响应速度和突出“行动要素”。
据报道,Android 16 主要是一项以提升用户体验为目标的质量改进更新。它将支持 Auracast 功能,使在蓝牙设备之间切换更为便捷。除此之外,还将引入锁屏小部件和一系列新的辅助功能。
谷歌还可能重点介绍最新版本的 Android XR(其混合现实操作系统)以及 Wear OS(谷歌为可穿戴设备提供的软件)的相关功能。
根据官方 I/O 日程安排,在 The Android Show 和 I/O 主题演讲之后,谷歌还有大量议题要讨论。
日程中列有专门针对 Chrome 与 Google Cloud、Google Play(Android 应用商店)、Android 开发工具以及 Gemma——谷歌推出的“开放” AI 模型集合——的专题会话。
去年,谷歌在 I/O 上发布了一些 AI 相关的惊喜项目,其中包括一系列针对教育应用进行微调的模型,名为 LearnLM。谷歌广受欢迎的播客生成工具 NotebookLM 的升级版本也可能成为一大亮点。泄露的代码显示了一个 “Video Overviews” 工具,该工具大概率用于创建视频摘要,很可能依托于谷歌的 Veo 2 视频生成模型。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。