随着Google确认Chrome浏览器将继续保留在其产品体系中,这款浏览器正在经历一次由Gemini驱动的重大变革。Google宣称Chrome将在未来几周内迎来有史以来最重要的升级,AI技术将渗透到用户体验的每个环节。对于已经使用AI工具的用户来说,这些新增功能可能确实有用,而对于其他用户,Firefox浏览器仍然是一个选择。
最显著的变化是在桌面浏览器中新增了Gemini按钮,这个功能对于AI订阅用户来说可能已经不陌生。点击这个按钮会弹出一个窗口,用户可以询问关于当前打开标签页内容的问题,并获得内容摘要。虽然Android手机已经在系统层面集成了Gemini来完成类似任务,但Google表示iOS版Gemini应用很快也将内置到Chrome中,为苹果设备用户提供同样的功能。
Gemini的功能并不局限于当前标签页。Google的目标是让用户能够在不离开当前屏幕的情况下与其他应用和标签页进行交互。当在Chrome中调用Gemini时,它能够处理所有打开标签页中的内容,并且可以连接到Google日历和YouTube等Google产品。它甚至能根据模糊的记忆在浏览历史中找到相关链接。
AI模式也正在成为Google在网络搜索中的默认方式。更新后的Chrome现在允许用户直接从地址栏开始AI模式搜索。虽然需要点击按钮来启用AI模式,但在浏览器中用AI模式替代传统搜索变得非常容易。地址栏还将获得"询问此页面"功能。Chrome可以建议这些问题(目前仅支持英文),并在侧边面板显示答案。答案自然会以AI概览开头,用户还可以在AI模式下提出后续问题。
Google表示它还在使用AI来加强Chrome的安全性。Gemini工具已经能够识别常见的技术支持诈骗。一个更新的Gemini Nano模型将被部署,扩展这些检测功能以发现虚假病毒警报和虚假赠品。Chrome的密码管理器已经能告知用户被泄露的密码,但通过AI升级,它现在还能一键自动更改这些密码。不过,这个功能似乎容易出错。
智能体的未来
浏览器的大部分新AI功能都是我们在测试或早期访问中见过的,它们将在未来几周内完全向Chrome用户推出。Chrome的下一个技巧需要更长时间。Google表示,今年晚些时候将为Chrome添加智能体控制功能。
过去一年我们已经看到了一些这样的"使用智能体",包括OpenAI的Operator和Anthropic的Claude for Chrome。这些系统理论上可以控制计算机光标来代替用户完成任务。Google建议将预约理发或订购杂货等繁琐或重复性工作交给Chrome智能体完成。只需输入请求,然后观看它执行即可。
到目前为止,使用智能体面临两个重要问题:速度慢且成本高。这些是生成式AI系统,即使在处理大量昂贵Token时也不会完美执行。OpenAI Operator仅在每月200美元的订阅中提供有限使用,而Anthropic的智能体可能会为完成访问几个网页这样的简单操作收取几美元的API费用。
我们还不知道Google的Chrome智能体的可靠性或速度如何,也没有关于额外费用的消息。Google的博客文章甚至没有提到将此功能限制给订阅用户,但它确实对许多AI工具有模糊的限制。我们已经联系Google寻求这方面的澄清。
Google的智能体浏览助手可能不会比竞争对手的产品更好,但Chrome的普及程度将让这项技术接触到更多用户。但真的会是所有人吗?这家公司在AI领域烧钱获得立足点并不陌生,但让数十亿人使用昂贵的计算机使用模型可能对Google来说也是一个艰难的决定。
Q&A
Q1:Chrome浏览器新增的Gemini功能有什么作用?
A:Chrome浏览器新增的Gemini按钮可以让用户询问关于打开标签页内容的问题并获得摘要。Gemini能处理所有打开标签页的内容,连接Google日历和YouTube等产品,还能根据模糊记忆在浏览历史中找到相关链接。
Q2:Chrome的智能体控制功能什么时候上线?
A:Google表示智能体控制功能将在今年晚些时候添加到Chrome中。这个功能可以控制计算机光标代替用户完成任务,比如预约理发或订购杂货等繁琐重复性工作,用户只需输入请求即可。
Q3:Chrome的AI安全功能有哪些改进?
A:Chrome使用AI加强了安全性,Gemini工具能识别常见技术支持诈骗,更新的Gemini Nano模型可以发现虚假病毒警报和虚假赠品。密码管理器不仅能告知被泄露的密码,还能一键自动更改这些密码。
好文章,需要你的鼓励
杜克大学研究团队建立了首个专门针对Web智能体攻击检测的综合评估标准WAInjectBench。研究发现,现有攻击手段极其多样化,从图片像素篡改到隐藏弹窗无所不包。虽然检测方法对明显恶意指令有中等效果,但对隐蔽攻击几乎无能为力。研究构建了包含近千个恶意样本的测试数据库,评估了十二种检测方法,揭示了文本和图像检测的互补性。这项研究为Web智能体安全防护指明了方向,提醒我们在享受AI便利时必须保持安全意识。
生成式AI的兴起让谷歌和Meta两大科技巨头受益匪浅。谷歌母公司Alphabet第三季度广告收入同比增长12%达742亿美元,云服务收入增长33%至151.5亿美元,季度总收入首次突破千亿美元大关。Meta第三季度收入512.5亿美元,同比增长26%。两家公司都将大幅增加AI基础设施投资,Meta预计2025年资本支出提升至700亿美元,Alphabet预计达910-930亿美元。
加州大学圣地亚哥分校研究团队系统研究了AI智能体多回合强化学习训练方法,通过环境、策略、奖励三大支柱的协同设计,提出了完整的训练方案。研究在文本游戏、虚拟家庭和软件工程等多个场景验证了方法有效性,发现简单环境训练能迁移到复杂任务,监督学习初始化能显著减少样本需求,密集奖励能改善学习效果。这为训练能处理复杂多步骤任务的AI智能体提供了实用指南。