Google I/O 是谷歌年度最大的开发者大会,即将拉开帷幕。
会议定于 5 月 20 日至 21 日在 Mountain View 的 Shoreline Amphitheatre 举行,届时谷歌将展示其全产品线的新产品发布。大家可以期待关于 Android、Chrome、Google Search、YouTube 以及——当然——谷歌的基于 AI 的聊天机器人 Gemini 的大量新闻。
以下是主要亮点。
AI 是当前的热门技术,和竞争对手一样,谷歌也在这方面投入巨资。
I/O 大会的必然亮点之一是谷歌旗舰 Gemini 系列 AI 模型的新补充(或若干补充)。过去几周的泄露信息显示,一款升级版的 Gemini Ultra 正在路上,而 Gemini Ultra 是谷歌顶级的 Gemini 产品。
随着这一升级版本的推出,可能会推出更高价位的 Gemini 订阅服务。
目前,谷歌仅提供单一的高端订阅级别 Gemini Advanced(每月 ),可解锁其由 Gemini 模型提供支持的聊天机器人更多的功能。但谷歌可能很快会推出两个全新计划:Premium Plus 和 Premium Pro。具体能提供哪些额外功能以及这些计划相对于 Gemini Advanced 的定价方式,目前尚不明确。
谷歌几乎可以肯定会谈及 Astra,这是其旨在构建 AI 应用和“agents”以实现实时、多模态理解的广泛计划。此外,议程上很可能还会包括 Project Mariner,这是谷歌的 AI “agents”,能够在用户的代理下在网络中导航并执行操作。有人在 X 平台上发现了谷歌 AI Studio 开发者平台代码中对 “Computer Use” 的提及,这很可能与 Mariner 计划相关。
今年谷歌首次单独举办一场专门介绍 Android 更新的活动——The Android Show,该活动将在 I/O 前一周左右的星期二举行。
活动重点将是最新版本的 Android——Android 16。预计 Android 16 将带来改进的通知系统和全新设计语言 Material 3 Expressive。在一篇泄露的博客文章中,谷歌将 Material 3 Expressive 描述为一次彻底的革新,具有更高的响应速度和突出“行动要素”。
据报道,Android 16 主要是一项以提升用户体验为目标的质量改进更新。它将支持 Auracast 功能,使在蓝牙设备之间切换更为便捷。除此之外,还将引入锁屏小部件和一系列新的辅助功能。
谷歌还可能重点介绍最新版本的 Android XR(其混合现实操作系统)以及 Wear OS(谷歌为可穿戴设备提供的软件)的相关功能。
根据官方 I/O 日程安排,在 The Android Show 和 I/O 主题演讲之后,谷歌还有大量议题要讨论。
日程中列有专门针对 Chrome 与 Google Cloud、Google Play(Android 应用商店)、Android 开发工具以及 Gemma——谷歌推出的“开放” AI 模型集合——的专题会话。
去年,谷歌在 I/O 上发布了一些 AI 相关的惊喜项目,其中包括一系列针对教育应用进行微调的模型,名为 LearnLM。谷歌广受欢迎的播客生成工具 NotebookLM 的升级版本也可能成为一大亮点。泄露的代码显示了一个 “Video Overviews” 工具,该工具大概率用于创建视频摘要,很可能依托于谷歌的 Veo 2 视频生成模型。
好文章,需要你的鼓励
据报道,OpenAI正准备发布一款由即将推出的Sora 2视频模型驱动的独立社交应用。该应用与TikTok高度相似,采用垂直视频信息流和滑动滚动导航。不过,该应用仅支持AI生成的内容,用户无法从手机相册上传照片或视频。Sora 2在应用内生成的视频时长限制为10秒或更短。应用还包含身份验证工具,允许用户使用自己的肖像生成视频,其他用户可以标记并在重新混合视频时使用他们的肖像。
北卡罗来纳大学研究团队通过深入分析手指触控过程中的动态特征,开发出新型触控识别算法,能够理解触控过程中的压力分布、接触面积变化等信息,比传统方法准确率提高15-28%。该技术采用分层处理架构解决计算效率问题,已在真实设备上验证效果,将为个性化交互、情感感知等未来应用奠定基础,有望显著改善用户的触控体验。
微软发布全新Agent Mode功能,支持Excel和Word中的AI代理协作。该模式可自动生成高质量文档、电子表格和演示文稿,让非专业用户也能使用复杂功能。Excel代理模式在准确性测试中达到57.2%,远超原版Copilot的20%。Word代理模式则专注于内容起草和格式优化,让写作变成对话式体验。目前已向商业用户和个人订阅用户开放。
Perfios公司研究团队开发了创新的AI理财顾问训练框架,通过行为心理学驱动的数据生成方法,让8B参数的小模型在个人理财建议方面达到了与32B大模型相当的性能,同时运营成本降低80%。该方法首次将用户心理状态分析作为独立训练阶段,显著提升了AI建议的个性化程度和人性化表达,为普及化AI理财服务提供了技术路径。