Google长期以来一直使用其Chrome网络浏览器来推广自家产品和服务,特别是巩固其在搜索领域的主导地位,现在它正试图在人工智能领域做同样的事情。
该公司今天宣布将通过其AI助手Gemini为Chrome增加一系列新的AI功能。Google正在提升其AI模式的显著性,这是一个更具对话性的搜索工具,并将把智能体集成到浏览器中,这样用户就能要求它代表自己完成浏览任务。
在一篇博客文章中,Chrome产品副总裁Mike Torres表示,用户很快就能直接从浏览器地址栏调用AI模式。它将添加一个名为"全能框"的新工具,人们可以在其中输入搜索短语或提出问题,无需离开当前浏览的页面就能获得对话式回应。
Google还将Gemini AI助手集成到Chrome中,用户可以就正在浏览的网页向它提问。Torres说,它还能看到所有其他打开的标签页并回答相关问题。这个功能已经存在几个月了,但之前只对付费用户开放,现在已免费提供。
Gemini可以帮助用户比较和汇总来自多个打开标签页的信息。所以如果有人在多个不同网站上搜索航班、酒店和活动,他们可以要求Gemini将找到的内容整合成单一行程单。
据Torres介绍,Gemini将能够记住用户的浏览历史,以更好地理解他们查询的上下文。他说,它还会将Chrome链接到其他Google服务,如YouTube和Google Calendar。
Google在2008年推出了Chrome浏览器,从那时起它已成为全球最受欢迎的浏览器,根据Statcounter的数据,占据了约70%的全球网络浏览器市场份额。该公司利用其浏览器主导地位确保Google在搜索领域保持主导地位,每当有人购买新设备时,它会立即询问用户是否希望将Google设为"默认"搜索引擎。此外,浏览器还从用户那里收集有用数据,有助于改进其搜索算法。
该公司因这种做法而陷入麻烦,在美国司法部最近提起的反托拉斯诉讼中,它被迫结束这种做法并为用户提供默认搜索引擎的选择,同时还要分享一些搜索数据。
然而,很明显Chrome策略是成功的,现在Google似乎在其AI服务上采用同样的策略。通过将Gemini与Chrome集成,它可以帮助增加市场份额,与OpenAI的ChatGPT等其他AI聊天机器人竞争,并收集更多关于人们如何使用AI的数据。
智能体浏览即将到来
Gemini正在Chrome中推出,但最具影响力的新AI功能要几个月后才能使用。
Torres说,该公司计划推出"智能体浏览助手",它将能够代表用户自主完成各种与浏览器相关的任务。Chrome智能体将能够完成诸如填充亚马逊购物车、回复电子邮件、从网站复制粘贴信息到文档中以便更容易访问等任务。
智能体体验将能够在后台运行,因此可以指示它去亚马逊购买产品,而用户可以继续在Chrome中做其他事情。但是,如果智能体需要澄清某些事情,比如用户偏好的牛仔裤品牌,它会中断用户进行询问。
Torres说,智能体还会在完成不可逆转的操作之前要求确认,比如实际发送它写的电子邮件或在亚马逊上结账付款。在这种情况下,它会在执行这些操作之前要求用户明确许可。不过,鉴于Google昨天刚刚透露它正在开发一个名为AP2的智能体支付协议,最终将使AI智能体能够代表用户进行预授权支付,这种做法在未来是否会改变还不清楚。
Google并不是第一个推出浏览器智能体的公司。实际上,它在这个游戏中有点迟到,OpenAI的Operator和Anthropic的Chrome版Claude都提供了类似的自主浏览功能。不过,这些功能仍处于起步阶段,所以不确定Google的Chrome智能体实际上会有多有用。
就OpenAI的Operator而言,它似乎仍然容易出现故障且不总是可靠。它也相当慢,而且价格昂贵。该功能被锁在每月200美元的付费墙后面,即使如此,使用也受到限制,因为它在自主浏览时会使用大量"Token"。
不过,Google可能具有其AI智能体将"原生"于Chrome的优势。Torres说,该公司一直在关注竞争对手的实验,并将确保其产品在推出时"更加稳健"。值得注意的是,这是该公司已经研发了近一年的项目,所以它很可能比竞争对手做得更好。"我们希望,当这个功能到达用户手中时,我们已经解决了许多潜在的问题,"他说。
Google没有说是否打算将Chrome的智能体功能作为付费功能提供,但如果免费提供将会令人惊讶。
Q&A
Q1:Google在Chrome中集成了什么AI功能?
A:Google在Chrome中集成了Gemini AI助手,增加了AI模式和全能框功能,用户可以直接在地址栏进行对话式搜索,Gemini还能分析网页内容、记住浏览历史、整合多个标签页信息,并连接YouTube和Google Calendar等服务。
Q2:Chrome的智能体浏览助手能做什么?
A:Chrome智能体能够自主完成各种浏览器任务,包括填充亚马逊购物车、回复电子邮件、复制粘贴网站信息到文档等。它可以在后台运行,在需要用户确认或澄清信息时会进行询问,在执行不可逆操作前会要求明确许可。
Q3:Google的浏览器智能体与竞争对手相比有什么优势?
A:与OpenAI的Operator和Anthropic的Claude相比,Google的智能体将原生集成于Chrome浏览器,公司已研发近一年时间。而竞争对手的产品仍存在故障多、速度慢、价格昂贵等问题,Google希望推出时能提供更稳健的体验。
好文章,需要你的鼓励
网络安全公司Netskope今日成功上市,股价开盘后大涨18%,收盘价为22.49美元。该公司此次IPO发行价为19美元,位于定价区间上端,共发行4780万股,募资9.08亿美元。Netskope主要提供安全访问服务边缘(SASE)平台,其旗舰产品Netskope One在全球120多个数据中心运行。公司年度经常性收入达7.07亿美元,同比增长33%。
腾讯混元团队推出P3-SAM系统,这是首个能够自动精确分割任意3D物体的AI模型。该系统采用原生3D处理方式,摆脱了传统方法对2D投影的依赖,在近370万个3D模型上训练而成。P3-SAM支持完全自动分割和交互式分割两种模式,在多个标准测试中达到领先性能,为游戏开发、工业设计等领域提供了强大的3D理解工具。
亚马逊云科技宣布在其AI模型组合中新增全托管开放权重模型Qwen3和DeepSeek-V3.1。这些模型为依赖Amazon Bedrock生成式AI服务的客户提供更大灵活性。Qwen3来自阿里巴巴,在编程和推理方面表现出色;DeepSeek-V3.1在数学、编程和智能体任务方面性能卓越。开放权重模型具有成本优势和选择优势,支持模型精调和定制化。AWS计划在亚洲、拉美、欧洲和北美等全球关键市场推出这些新模型。
NVIDIA Research推出了革命性的UDR系统,让用户可以完全自定义AI研究助手的工作策略。该系统解决了传统研究工具固化、难以专业化定制的问题,支持任意语言模型,用户可用自然语言编写研究策略,系统自动转换为可执行代码。提供三种示例策略和直观界面,实现了AI工具的民主化定制,为专业研究和个人调研提供了前所未有的灵活性。