OpenAI 推出了 Operator,这是一个能够自动代表用户执行任务的人工智能代理。
与此同时,该公司的两大主要竞争对手也宣布了各自的产品更新。拥有热门 AI 搜索引擎的初创公司 Perplexity AI Inc. 为其 Android 应用推出了类似 Operator 的代理。而已经提供此类自动化功能的 Anthropic PBC,则发布了一项新工具,使其 AI 模型能在回应中提供更好的引用。
OpenAI 的新型 Operator 代理目前作为研究预览版在 ChatGPT Pro 高级版中提供。它可以订购杂货、预订机票、填写表格和执行其他多步骤任务。用户可以通过输入自然语言提示来指示 Operator 执行任务。
在底层,该代理由一个新公布的名为 CUA 的 OpenAI 模型驱动。它部分基于该公司的多模态 GPT-4 大语言模型。OpenAI 表示,CUA 将大语言模型与"通过强化学习实现的高级推理"相结合。
当用户要求 Operator 在网站上执行任务时,代理会使用内置浏览器导航到相关 URL。它可以输入、点击和滚动以执行所需操作。Operator 会定期截屏以检查一切是否按预期运行。
OpenAI 详细说明,用户可以在工作流程的任何时候接管控制。对于输入登录凭证等敏感操作,Operator 会主动要求用户切换到手动模式。据 OpenAI 称,代理会在任务完成前停止截屏。
公司为 Operator 内置了多项数据保护功能。用户可以一键将其从所有账户注销,并阻止 OpenAI 使用其数据进行 AI 训练。此外,还有一个系统可以检测恶意网站试图欺骗 Operator 泄露敏感数据的行为。
代理的某些功能是可定制的。例如,用户可以保存购物清单,让 Operator 每次访问特定电商网站时购买指定商品。还可以创建适用于代理访问的所有网站的自定义设置。
展望未来,OpenAI 计划将 Operator 的可用范围从 ChatGPT Pro 扩展到聊天机器人的其他层级。该公司还将通过其应用程序接口提供该代理。在底层,OpenAI 计划添加增强功能,使 Operator 更擅长完成复杂任务。
"Operator 目前处于早期研究预览阶段,虽然它已经能够处理广泛的任务,但仍在学习、发展中,可能会出错," OpenAI 研究人员在博文中写道。"早期用户反馈将在提高其准确性、可靠性和安全性方面发挥重要作用。"
OpenAI 的竞争对手 Perplexity AI 今天也发布了自己的代理 Perplexity Assistant,可在其 Android 应用中使用。它可以自动进行电商购物、预订出租车等任务。多模态处理功能使 Perplexity Assistant 能够分析智能手机摄像头画面和用户屏幕上的内容。
该代理在发布时可以在 Spotify、YouTube 和 Uber 以及电子邮件、消息和时钟应用中执行操作。Perplexity AI 计划随时间推移添加更多服务支持。
另一个 OpenAI 的竞争对手 Anthropic 今天也宣布了产品更新。该公司通过 API 提供面向企业的 LLM 系列 Claude。使用新增的 Citations 功能,客户现在可以向 Claude 模型上传文档,并让它突出显示用于生成提示响应的具体句子。
好文章,需要你的鼓励
摩根士丹利最新分析显示,到2030年欧洲银行业可能削减超过20万个工作岗位,约占35家主要银行员工总数的10%。裁员主要集中在后台运营、风险管理和合规等领域,银行预期通过AI技术实现30%的效率提升。荷兰银行ABN Amro计划到2028年裁员五分之一,法国兴业银行CEO宣称"没有什么是神圣不可触碰的"。高盛也警告美国员工将实施裁员和招聘冻结。
瑞士ETH苏黎世联邦理工学院等机构联合开发的WUSH技术,首次从数学理论层面推导出AI大模型量化压缩的最优解。该技术能根据数据特征自适应调整压缩策略,相比传统方法减少60-70%的压缩损失,实现接近零损失的模型压缩,为大模型在普通设备上的高效部署开辟了新路径。
Safe软件CEO唐·默里认为,AI作为助手不可或缺,但绝非权威。他指出,在工程等高精度领域,AI准确率仅达80-90%,远低于99.999%的要求,因此必须保持"人在回路中"模式。默里担心企业过度依赖AI而不培养初级员工,当资深专家退休后将面临人才断层。他强调AI应用于提升团队整体水平,帮助初级员工快速成长,协助资深员工提高效率,但人类专业判断不可替代。
弗吉尼亚大学团队创建了Refer360数据集,这是首个大规模记录真实环境中人机多模态交互的数据库,涵盖室内外场景,包含1400万交互样本。同时开发的MuRes智能模块能让机器人像人类一样理解语言、手势和眼神的组合信息,显著提升了现有AI模型的理解准确度,为未来智能机器人的广泛应用奠定了重要基础。