随着Google确认Chrome浏览器将继续保留在其产品体系中,这款浏览器正在经历一次由Gemini驱动的重大变革。Google宣称Chrome将在未来几周内迎来有史以来最重要的升级,AI技术将渗透到用户体验的每个环节。对于已经使用AI工具的用户来说,这些新增功能可能确实有用,而对于其他用户,Firefox浏览器仍然是一个选择。
最显著的变化是在桌面浏览器中新增了Gemini按钮,这个功能对于AI订阅用户来说可能已经不陌生。点击这个按钮会弹出一个窗口,用户可以询问关于当前打开标签页内容的问题,并获得内容摘要。虽然Android手机已经在系统层面集成了Gemini来完成类似任务,但Google表示iOS版Gemini应用很快也将内置到Chrome中,为苹果设备用户提供同样的功能。
Gemini的功能并不局限于当前标签页。Google的目标是让用户能够在不离开当前屏幕的情况下与其他应用和标签页进行交互。当在Chrome中调用Gemini时,它能够处理所有打开标签页中的内容,并且可以连接到Google日历和YouTube等Google产品。它甚至能根据模糊的记忆在浏览历史中找到相关链接。
AI模式也正在成为Google在网络搜索中的默认方式。更新后的Chrome现在允许用户直接从地址栏开始AI模式搜索。虽然需要点击按钮来启用AI模式,但在浏览器中用AI模式替代传统搜索变得非常容易。地址栏还将获得"询问此页面"功能。Chrome可以建议这些问题(目前仅支持英文),并在侧边面板显示答案。答案自然会以AI概览开头,用户还可以在AI模式下提出后续问题。
Google表示它还在使用AI来加强Chrome的安全性。Gemini工具已经能够识别常见的技术支持诈骗。一个更新的Gemini Nano模型将被部署,扩展这些检测功能以发现虚假病毒警报和虚假赠品。Chrome的密码管理器已经能告知用户被泄露的密码,但通过AI升级,它现在还能一键自动更改这些密码。不过,这个功能似乎容易出错。
智能体的未来
浏览器的大部分新AI功能都是我们在测试或早期访问中见过的,它们将在未来几周内完全向Chrome用户推出。Chrome的下一个技巧需要更长时间。Google表示,今年晚些时候将为Chrome添加智能体控制功能。
过去一年我们已经看到了一些这样的"使用智能体",包括OpenAI的Operator和Anthropic的Claude for Chrome。这些系统理论上可以控制计算机光标来代替用户完成任务。Google建议将预约理发或订购杂货等繁琐或重复性工作交给Chrome智能体完成。只需输入请求,然后观看它执行即可。
到目前为止,使用智能体面临两个重要问题:速度慢且成本高。这些是生成式AI系统,即使在处理大量昂贵Token时也不会完美执行。OpenAI Operator仅在每月200美元的订阅中提供有限使用,而Anthropic的智能体可能会为完成访问几个网页这样的简单操作收取几美元的API费用。
我们还不知道Google的Chrome智能体的可靠性或速度如何,也没有关于额外费用的消息。Google的博客文章甚至没有提到将此功能限制给订阅用户,但它确实对许多AI工具有模糊的限制。我们已经联系Google寻求这方面的澄清。
Google的智能体浏览助手可能不会比竞争对手的产品更好,但Chrome的普及程度将让这项技术接触到更多用户。但真的会是所有人吗?这家公司在AI领域烧钱获得立足点并不陌生,但让数十亿人使用昂贵的计算机使用模型可能对Google来说也是一个艰难的决定。
Q&A
Q1:Chrome浏览器新增的Gemini功能有什么作用?
A:Chrome浏览器新增的Gemini按钮可以让用户询问关于打开标签页内容的问题并获得摘要。Gemini能处理所有打开标签页的内容,连接Google日历和YouTube等产品,还能根据模糊记忆在浏览历史中找到相关链接。
Q2:Chrome的智能体控制功能什么时候上线?
A:Google表示智能体控制功能将在今年晚些时候添加到Chrome中。这个功能可以控制计算机光标代替用户完成任务,比如预约理发或订购杂货等繁琐重复性工作,用户只需输入请求即可。
Q3:Chrome的AI安全功能有哪些改进?
A:Chrome使用AI加强了安全性,Gemini工具能识别常见技术支持诈骗,更新的Gemini Nano模型可以发现虚假病毒警报和虚假赠品。密码管理器不仅能告知被泄露的密码,还能一键自动更改这些密码。
好文章,需要你的鼓励
今天讲的出海案例是开创电气,一家金华手持式电动工具制造商,在越南基地完成首款产品验收并形成80万台年产能力。
JETSPEC是由UC San Diego等机构联合提出的推测解码框架,通过树形因果掩码让草稿头在一次前向传播中生成分支一致的候选树,在MATH-500上实现最高9.64倍端到端加速。
研究人员意外发现,标准MOSFET晶体管可同时模拟神经元和突触行为,形成"神经突触随机存取存储器"(NSRAM)。该技术仅需一至两个晶体管即可实现传统需数十乃至数百个元件才能完成的神经信号处理,且与现有硅基制造工艺完全兼容,良率达100%。未来有望应用于边缘AI及高能效神经形态芯片,长远或可挑战GPU地位。
本文介绍了中国科学院自动化所的研究,揭示了大型语言模型在多轮工具调用强化学习中崩溃的根本原因,并系统评估了五种监督信号对训练稳定性和泛化能力的影响。