随着Google确认Chrome浏览器将继续保留在其产品体系中,这款浏览器正在经历一次由Gemini驱动的重大变革。Google宣称Chrome将在未来几周内迎来有史以来最重要的升级,AI技术将渗透到用户体验的每个环节。对于已经使用AI工具的用户来说,这些新增功能可能确实有用,而对于其他用户,Firefox浏览器仍然是一个选择。
最显著的变化是在桌面浏览器中新增了Gemini按钮,这个功能对于AI订阅用户来说可能已经不陌生。点击这个按钮会弹出一个窗口,用户可以询问关于当前打开标签页内容的问题,并获得内容摘要。虽然Android手机已经在系统层面集成了Gemini来完成类似任务,但Google表示iOS版Gemini应用很快也将内置到Chrome中,为苹果设备用户提供同样的功能。
Gemini的功能并不局限于当前标签页。Google的目标是让用户能够在不离开当前屏幕的情况下与其他应用和标签页进行交互。当在Chrome中调用Gemini时,它能够处理所有打开标签页中的内容,并且可以连接到Google日历和YouTube等Google产品。它甚至能根据模糊的记忆在浏览历史中找到相关链接。
AI模式也正在成为Google在网络搜索中的默认方式。更新后的Chrome现在允许用户直接从地址栏开始AI模式搜索。虽然需要点击按钮来启用AI模式,但在浏览器中用AI模式替代传统搜索变得非常容易。地址栏还将获得"询问此页面"功能。Chrome可以建议这些问题(目前仅支持英文),并在侧边面板显示答案。答案自然会以AI概览开头,用户还可以在AI模式下提出后续问题。
Google表示它还在使用AI来加强Chrome的安全性。Gemini工具已经能够识别常见的技术支持诈骗。一个更新的Gemini Nano模型将被部署,扩展这些检测功能以发现虚假病毒警报和虚假赠品。Chrome的密码管理器已经能告知用户被泄露的密码,但通过AI升级,它现在还能一键自动更改这些密码。不过,这个功能似乎容易出错。
智能体的未来
浏览器的大部分新AI功能都是我们在测试或早期访问中见过的,它们将在未来几周内完全向Chrome用户推出。Chrome的下一个技巧需要更长时间。Google表示,今年晚些时候将为Chrome添加智能体控制功能。
过去一年我们已经看到了一些这样的"使用智能体",包括OpenAI的Operator和Anthropic的Claude for Chrome。这些系统理论上可以控制计算机光标来代替用户完成任务。Google建议将预约理发或订购杂货等繁琐或重复性工作交给Chrome智能体完成。只需输入请求,然后观看它执行即可。
到目前为止,使用智能体面临两个重要问题:速度慢且成本高。这些是生成式AI系统,即使在处理大量昂贵Token时也不会完美执行。OpenAI Operator仅在每月200美元的订阅中提供有限使用,而Anthropic的智能体可能会为完成访问几个网页这样的简单操作收取几美元的API费用。
我们还不知道Google的Chrome智能体的可靠性或速度如何,也没有关于额外费用的消息。Google的博客文章甚至没有提到将此功能限制给订阅用户,但它确实对许多AI工具有模糊的限制。我们已经联系Google寻求这方面的澄清。
Google的智能体浏览助手可能不会比竞争对手的产品更好,但Chrome的普及程度将让这项技术接触到更多用户。但真的会是所有人吗?这家公司在AI领域烧钱获得立足点并不陌生,但让数十亿人使用昂贵的计算机使用模型可能对Google来说也是一个艰难的决定。
Q&A
Q1:Chrome浏览器新增的Gemini功能有什么作用?
A:Chrome浏览器新增的Gemini按钮可以让用户询问关于打开标签页内容的问题并获得摘要。Gemini能处理所有打开标签页的内容,连接Google日历和YouTube等产品,还能根据模糊记忆在浏览历史中找到相关链接。
Q2:Chrome的智能体控制功能什么时候上线?
A:Google表示智能体控制功能将在今年晚些时候添加到Chrome中。这个功能可以控制计算机光标代替用户完成任务,比如预约理发或订购杂货等繁琐重复性工作,用户只需输入请求即可。
Q3:Chrome的AI安全功能有哪些改进?
A:Chrome使用AI加强了安全性,Gemini工具能识别常见技术支持诈骗,更新的Gemini Nano模型可以发现虚假病毒警报和虚假赠品。密码管理器不仅能告知被泄露的密码,还能一键自动更改这些密码。
好文章,需要你的鼓励
在Meta Connect大会上,Meta展示了新一代Ray-Ban智能眼镜的硬件实力,配备神经腕带支持手势控制,电池续航翻倍,摄像头性能提升。然而AI演示却频频失败,包括Live AI烹饪指导、WhatsApp通话和实时翻译功能都出现问题。尽管Meta在智能眼镜硬件方面表现出色,但AI软件仍远未达到扎克伯格提出的"超级智能"目标。文章建议Meta考虑开放AI生态,允许用户选择其他AI服务商,这可能帮助Meta在AI硬件市场获得优势。
人民大学团队开发了Search-o1框架,让AI在推理时能像侦探一样边查资料边思考。系统通过检测不确定性词汇自动触发搜索,并用知识精炼模块从海量资料中提取关键信息无缝融入推理过程。在博士级科学问题测试中,该系统整体准确率达63.6%,在物理和生物领域甚至超越人类专家水平,为AI推理能力带来突破性提升。
英伟达同意以50亿美元收购英特尔股份,双方将合作开发多代数据中心和PC产品。英伟达将以每股23.28美元的价格收购约4%的英特尔股份,成为其最大股东之一。两家公司将通过NVLink接口整合各自架构,实现CPU和GPU间的高速数据传输。英特尔将为英伟达AI平台定制x86处理器,并开发集成RTX GPU的x86系统级芯片,用于消费级PC市场。
Anthropic研究团队开发的REINFORCE++算法通过采用全局优势标准化解决了AI训练中的"过度拟合"问题。该算法摒弃了传统PPO方法中昂贵的价值网络组件,用统一评价标准替代针对单个问题的局部基准,有效避免了"奖励破解"现象。实验显示,REINFORCE++在处理新问题时表现更稳定,特别是在长文本推理和工具集成场景中展现出优异的泛化能力,为开发更实用可靠的AI系统提供了新思路。