2025年成为AI浏览器元年,OpenAI、Perplexity、Opera和The Browser Company等公司纷纷推出具备侧边栏助手和自动化任务的AI浏览器,试图挑战Chrome的地位。现在,谷歌正通过为全球最大市场份额的Chrome浏览器添加类似功能来展示其AI实力。
虽然谷歌去年9月就将Gemini引入了Chrome,但当时助手只存在于浮动窗口中。此次更新将AI助手整合到持久化侧边栏,用户可以询问当前网页或其他打开标签页的相关问题。
多标签页情境感知功能
谷歌在今日发布前向媒体展示的一个有趣功能涉及多标签页处理。当你从单个网页打开不同标签页时,Gemini侧边栏会将它们理解为一个情境组。这在比较价格或考虑购买不同产品时特别有用。
在此之前,Chrome中的Gemini功能仅限Windows和MacOS用户使用。随着此次推广,侧边栏功能也将向Chromebook Plus用户开放。
个人智能功能整合
谷歌还充分利用了其新推出的个人智能功能,该功能连接用户的Gmail、搜索、YouTube和Google相册账户,允许基于个人数据进行询问。这项功能将在未来几个月内在Chrome中推出,意味着用户可以在侧边栏询问Gemini关于家庭日程安排等问题,或者让它起草并发送邮件而无需切换到Gmail。
Chrome还将新增Nano Banana整合功能,允许用户使用浏览时发现的其他图像或产品来修改现有图像。
自动浏览功能开启智能体时代
最具雄心的功能是"自动浏览",旨在使用用户个人信息并代表用户遍历网站来处理任务。例如,用户可以要求智能体功能前往特定网站购买商品并寻找折扣券。在执行数据敏感任务时,如登录网站或最终购买时,智能体会请求用户干预。
谷歌去年解释称,这些功能将使用Chrome的密码管理器或保存的卡片详情,但其AI模型不会接触到任何这些详细信息。
该功能最初向美国的AI Pro和Ultra订阅用户推出。
实际应用挑战与前景
基于浏览器的智能体往往不稳定,经常无法完成任务。谷歌的演示,就像许多其他AI演示一样,涉及购物和旅行规划。在实际使用案例中,智能体往往无法理解意图或在遍历不同网站时出现故障,这将成为更广泛采用的挑战。
谷歌表示,在早期测试中,用户已使用该功能进行预约安排、填写繁琐的在线表格、收集税务文件、获取水电工报价以及填写费用报告等任务。
谷歌表示,Gemini侧边栏支持和Nano Banana整合功能从今日开始推出,而个人智能功能将在"未来几个月"内提供。
Q&A
Q1:Chrome的新Gemini侧边栏有什么特别功能?
A:新的Gemini侧边栏可以理解多标签页作为情境组,在用户从单个网页打开不同标签时,帮助比较价格或产品。用户还可以询问当前网页或其他打开标签页的相关问题,比传统浮动窗口更方便。
Q2:Chrome的自动浏览功能安全吗?
A:谷歌表示自动浏览功能在执行敏感任务如登录网站或购买时会要求用户干预。虽然功能使用Chrome的密码管理器和卡片信息,但AI模型不会接触到这些敏感详情。
Q3:普通用户什么时候能使用Chrome的AI功能?
A:Gemini侧边栏支持从今日开始推出,面向Windows、MacOS和Chromebook Plus用户。自动浏览功能目前仅向美国AI Pro和Ultra订阅用户开放,个人智能功能将在未来几个月推出。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。