歌剧魅影：懒人福音，AI 代理现已潜入浏览器

Opera浏览器现在拥有“代理AI”，用户可以请求内置的AI模型执行需要一系列浏览器内操作的任务。虽然这项技术展示可能有趣，但实际上它只是将网络浏览委托给一个能力有限的个人助手。AI代理被称为浏览器操作员，可以帮助用户找到可购买的12双10码Nike袜子。尽管用户可以在15秒内通过访问Walmart在线商店完成相同操作，但这项技术的推出标志着浏览器角色的转变。

Opera 网页浏览器现在推出了"代理式 AI"功能，用户可以要求内置的 AI 模型执行一系列浏览器操作任务。

这基本上相当于将网页浏览任务委托给一个能力有限但可以处理某些事情的个人助理。虽然作为技术演示可能很有趣，但说实话，这有点夸张。

这个被称为"Browser Operator"的 AI 代理可以完成诸如查找 12 双男士 10 码 Nike 袜子等购物任务。在 Opera 制作的演示视频中（部分内容以 6 倍速播放），展示了用户只需要输入购买内衣的请求，而不是在网页上四处点击。

在给出的示例中，AI 通过浏览器聊天侧边栏完成了八个步骤，代替用户在网页显示窗格中进行点击和导航，最终到达 Walmart 的结账页面，并将两包共六双袜子添加到用户的购物车中，随时可以付款。

当然，你也可以在 15 秒内访问 Walmart 在线商店并点击几下就能完成同样的操作。不过这样一来，你的 AI 代理就失业了，这倒是挺讽刺的。

视频中还展示了其他任务，如查找特定音乐会门票和预订从奥斯陆到纽卡斯尔的机票，播放速度从 4 倍到 10 倍不等，最后由用户授权实际购买。

Browser Operator 的实际运行速度比视频中显示的要慢，不过这对于一个半自动助手来说反而是有帮助的。较慢的节奏允许用户随时介入并接管控制。

Opera Software 的执行副总裁 Krystian Kolondra 在一份声明中说："30 多年来，浏览器让你能够访问网络，但从未能为你完成具体任务。"这种说法似乎忽视了解析现代 HTML 页面（包含 CSS 和 JavaScript）所需的数十亿个 CPU 周期。

"现在可以了。这与我们之前看到或发布的任何功能都不同。今天我们展示的 Browser Operator 标志着浏览器角色的首次转变，从显示引擎转变为能够为用户执行任务的代理应用程序。"

"现在可以了"实际上意味着"现在部分用户可以使用"—— Browser Operator 目前是一个预览功能，只有部分用户可以访问，尚未普遍可用。当我们在设置和标志菜单中寻找启用选项时，最新的 macOS 版 Opera 和 Opera Developer 版本都尚未支持 Browser Operator。

据该公司称，Browser Operator 将在不久的将来通过公司的 AI 功能发布计划推出。

据 Opera 称，Browser Operator 在本地运行。"它通过不依赖浏览会话的截图或视频捕获，也不依赖云端或虚拟机中运行的浏览器版本来保护用户隐私。"开发者如此声称。

其 Aria 设置页面包含以下警告："AI 服务不应用于任何法律、医疗或咨询目的。我们建议您保持谨慎并核实事实。"

OpenAI 和 Anthropic 都发布了面向代理的服务，具体包括 OpenAI Operator 和 Anthropic 的 Claude 3.7 和 3.5 Sonnet 计算机使用 API。

令人惊讶的是，《华尔街日报》在 1 月份报道称，一些公司实际上正在使用 AI 代理。

Gartner 上周预测，在未来几年内，AI 代理将在企业运营中发挥重要作用。该 IT 咨询公司表示："到 2028 年，Gartner 预测 33% 的企业软件应用程序将包含代理式 AI，而 2024 年这一比例不到 1%，至少 15% 的日常工作决策将通过 AI 代理自主完成。"

请记住，Gartner 此前也出现过错误预测。2014 年，Gartner 研究总监 Peter Sondergaard 预测"到 2025 年，三分之一的工作将被软件、机器人和智能机器取代。"仅仅三年后，Gartner 就改口说 AI 创造的工作岗位将多于它消除的岗位。

来源：The Register

0赞

好文章，需要你的鼓励

歌剧魅影：懒人福音，AI 代理现已潜入浏览器

来源：The Register

2025

03/04

10:27

分享

点赞

至顶AI实验室硬核评测：HP Z2 Mini G1a工作站，仅30分钟还原毛利侦探事务所

冷板式液冷CDU系统

开箱 NVIDIA DGX Spark： 把一千万亿次算力，“塞进”ipad mini大小的盒子里

我们希望AI有多智能？世界模型可能比我们更懂世界

首席信息官角色将在2026年扩展的四种方式

Waymo正在测试Gemini在无人驾驶出租车中的车载AI助手功能

数据中心从幕后走向台前的转折之年

意大利要求Meta暂停禁止竞争对手AI聊天机器人使用WhatsApp的政策

让老旧Windows和macOS系统延续生命力

微软计划到2030年用Rust语言替换所有C和C++代码

2026年创客工具迎来重大升级，这些新技术值得期待

2025年十大网络故事盘点

AI 时代的数据中心：未来十年规划展望

AI 编程助手拒绝写代码，建议用户自学编程

超越 ChatGPT：通往通用人工智能的 5 大挑战

Oracle 在 AI 主流化方面具有重大优势

Snap 推出基于自研生成模型的 AI 视频滤镜

Google 的 Gemma 3：一款支持 128K 上下文窗口的开源单 GPU AI 模型

精灵宝可梦 GO 迎来新东家，而 Niantic 正借助 AI 和 AR 重塑地图业务

Google 的 Gemini 2.0 Flash 原生多模态 AI 图像生成功能给人留下深刻印象

Google 推出两款全新 AI 机器人控制模型

Nvidia 赢得了 AI 训练竞赛，但推理市场仍未尘埃落定

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

开箱 NVIDIA DGX Spark：把一千万亿次算力，“塞进”ipad mini大小的盒子里