随着Google确认Chrome浏览器将继续保留在其产品体系中,这款浏览器正在经历一次由Gemini驱动的重大变革。Google宣称Chrome将在未来几周内迎来有史以来最重要的升级,AI技术将渗透到用户体验的每个环节。对于已经使用AI工具的用户来说,这些新增功能可能确实有用,而对于其他用户,Firefox浏览器仍然是一个选择。
最显著的变化是在桌面浏览器中新增了Gemini按钮,这个功能对于AI订阅用户来说可能已经不陌生。点击这个按钮会弹出一个窗口,用户可以询问关于当前打开标签页内容的问题,并获得内容摘要。虽然Android手机已经在系统层面集成了Gemini来完成类似任务,但Google表示iOS版Gemini应用很快也将内置到Chrome中,为苹果设备用户提供同样的功能。
Gemini的功能并不局限于当前标签页。Google的目标是让用户能够在不离开当前屏幕的情况下与其他应用和标签页进行交互。当在Chrome中调用Gemini时,它能够处理所有打开标签页中的内容,并且可以连接到Google日历和YouTube等Google产品。它甚至能根据模糊的记忆在浏览历史中找到相关链接。
AI模式也正在成为Google在网络搜索中的默认方式。更新后的Chrome现在允许用户直接从地址栏开始AI模式搜索。虽然需要点击按钮来启用AI模式,但在浏览器中用AI模式替代传统搜索变得非常容易。地址栏还将获得"询问此页面"功能。Chrome可以建议这些问题(目前仅支持英文),并在侧边面板显示答案。答案自然会以AI概览开头,用户还可以在AI模式下提出后续问题。
Google表示它还在使用AI来加强Chrome的安全性。Gemini工具已经能够识别常见的技术支持诈骗。一个更新的Gemini Nano模型将被部署,扩展这些检测功能以发现虚假病毒警报和虚假赠品。Chrome的密码管理器已经能告知用户被泄露的密码,但通过AI升级,它现在还能一键自动更改这些密码。不过,这个功能似乎容易出错。
智能体的未来
浏览器的大部分新AI功能都是我们在测试或早期访问中见过的,它们将在未来几周内完全向Chrome用户推出。Chrome的下一个技巧需要更长时间。Google表示,今年晚些时候将为Chrome添加智能体控制功能。
过去一年我们已经看到了一些这样的"使用智能体",包括OpenAI的Operator和Anthropic的Claude for Chrome。这些系统理论上可以控制计算机光标来代替用户完成任务。Google建议将预约理发或订购杂货等繁琐或重复性工作交给Chrome智能体完成。只需输入请求,然后观看它执行即可。
到目前为止,使用智能体面临两个重要问题:速度慢且成本高。这些是生成式AI系统,即使在处理大量昂贵Token时也不会完美执行。OpenAI Operator仅在每月200美元的订阅中提供有限使用,而Anthropic的智能体可能会为完成访问几个网页这样的简单操作收取几美元的API费用。
我们还不知道Google的Chrome智能体的可靠性或速度如何,也没有关于额外费用的消息。Google的博客文章甚至没有提到将此功能限制给订阅用户,但它确实对许多AI工具有模糊的限制。我们已经联系Google寻求这方面的澄清。
Google的智能体浏览助手可能不会比竞争对手的产品更好,但Chrome的普及程度将让这项技术接触到更多用户。但真的会是所有人吗?这家公司在AI领域烧钱获得立足点并不陌生,但让数十亿人使用昂贵的计算机使用模型可能对Google来说也是一个艰难的决定。
Q&A
Q1:Chrome浏览器新增的Gemini功能有什么作用?
A:Chrome浏览器新增的Gemini按钮可以让用户询问关于打开标签页内容的问题并获得摘要。Gemini能处理所有打开标签页的内容,连接Google日历和YouTube等产品,还能根据模糊记忆在浏览历史中找到相关链接。
Q2:Chrome的智能体控制功能什么时候上线?
A:Google表示智能体控制功能将在今年晚些时候添加到Chrome中。这个功能可以控制计算机光标代替用户完成任务,比如预约理发或订购杂货等繁琐重复性工作,用户只需输入请求即可。
Q3:Chrome的AI安全功能有哪些改进?
A:Chrome使用AI加强了安全性,Gemini工具能识别常见技术支持诈骗,更新的Gemini Nano模型可以发现虚假病毒警报和虚假赠品。密码管理器不仅能告知被泄露的密码,还能一键自动更改这些密码。
好文章,需要你的鼓励
研究人员基于Meta前首席AI科学家Yann LeCun提出的联合嵌入预测架构,开发了名为JETS的自监督时间序列基础模型。该模型能够处理不规则的可穿戴设备数据,通过学习预测缺失数据的含义而非数据本身,成功检测多种疾病。在高血压检测中AUROC达86.8%,心房扑动检测达70.5%。研究显示即使只有15%的参与者有标注医疗记录,该模型仍能有效利用85%的未标注数据进行训练,为利用不完整健康数据提供了新思路。
西湖大学等机构联合发布TwinFlow技术,通过创新的"双轨道"设计实现AI图像生成的革命性突破。该技术让原本需要40-100步的图像生成过程缩短到仅需1步,速度提升100倍且质量几乎无损。TwinFlow采用自我对抗机制,无需额外辅助模型,成功应用于200亿参数超大模型,在GenEval等标准测试中表现卓越,为实时AI图像生成应用开辟了广阔前景。
AI云基础设施提供商Coreweave今年经历了起伏。3月份IPO未达预期,10月收购Core Scientific计划因股东反对而搁浅。CEO Michael Intrator为公司表现辩护,称正在创建云计算新商业模式。面对股价波动和高负债质疑,他表示这是颠覆性创新的必然过程。公司从加密货币挖矿转型为AI基础设施提供商,与微软、OpenAI等巨头合作。对于AI行业循环投资批评,Intrator认为这是应对供需剧变的合作方式。
中山大学等机构联合开发的RealGen框架成功解决了AI生成图像的"塑料感"问题。该技术通过"探测器奖励"机制,让AI在躲避图像检测器识别的过程中学会制作更逼真照片。实验显示,RealGen在逼真度评测中大幅领先现有模型,在与真实照片对比中胜率接近50%,为AI图像生成技术带来重要突破。