Anthropic PBC希望用户将计算机控制权交给Claude,宣布为其人工智能助手推出全新"计算机使用"功能,现在它可以代表用户点击、滚动和浏览网页及应用程序来完成任务。
该功能今天作为研究预览版向Claude Pro和Max订阅用户推出,值得注意的是它与上周首次亮相的移动工具Dispatch配对使用。通过Dispatch,用户可以从智能手机向Claude分配任务,并让它使用他们的计算机完成这些任务。
在博客文章中,Anthropic解释说,当Claude接到要完成的任务时,它会查看是否有合适的集成来使用Google Calendar和Slack等工具执行任务。但如果没有合适的连接器,它会回退到像人类一样控制计算机,使用屏幕进行导航。它可以打开文件和文档,操作网络浏览器并自主运行开发工具。
这次更新对开发人员特别有用。Anthropic表示,Claude可以在集成开发环境中进行更改、提交拉取请求、运行测试等等,让人类用户专注于其他任务。出于安全考虑,该系统基于权限优先的方法。这意味着Claude在接触新应用程序之前会请求访问权限,用户可以随时停止它。
尚未准备就绪
Anthropic并未试图过度推销这项功能,承认它仍在开发中。"与Claude的编程能力或文本交互能力相比,计算机使用功能仍处于早期阶段,"该公司解释道。"Claude可能会犯错误,虽然我们持续改进安全防护措施,但威胁在不断演变。"
一个明显的限制是目前仅适用于Mac计算机,因此Windows或Linux PC用户暂时只能观望。其目的是从用户那里获得关于哪些方面需要更多关注的见解,这样公司就能创造更强大的工具。因此,一些复杂任务可能需要多次尝试Claude才能正确完成,其基于屏幕的操作比直接应用程序编程接口集成要慢得多。
还存在一些安全担忧。将计算机控制权交给Claude可能非常方便,但也可能使Mac容易受到某些类型的网络攻击。虽然Anthropic没有明确表示,但Claude的计算机使用能力很可能是通过OpenClaw实现的,该工具构建了一个"Claws"生态系统,使AI模型能够使用第三方软件。
但这些Claws可能容易被劫持,潜在地使恶意行为者能够控制聊天机器人有权访问的任何数据和系统。Anthropic表示已实施防护措施来防范提示注入攻击等风险,这是对具有计算机访问权限的AI工具的流行攻击手段。它还会自动扫描其他漏洞,但即便如此,Anthropic建议在研究预览期间避免让Claude访问敏感数据。
这次发布正值Anthropic的繁忙时期,该公司最近几周推出了一系列更新,同时在Claude限制问题上与特朗普政府产生分歧。上个月它推出了Claude Opus 4.6和Claude Sonnet 4.6的重大更新,这两个模型都针对复杂的智能体工作流程——正是那种能从使用计算机中受益的任务类型。
计算机控制是AI开发人员的关键目标,因为这对于从智能对话伙伴向不仅仅提供信息的自主助手转变至关重要。包括OpenAI集团和谷歌在内的竞争对手也在竞相提供能够安全操作计算机的系统。
Q&A
Q1:Claude的计算机使用功能具体能做什么?
A:Claude可以像人类一样控制计算机,包括点击、滚动和浏览网页及应用程序来完成任务。它能打开文件和文档,操作网络浏览器,运行开发工具,在集成开发环境中进行更改、提交拉取请求、运行测试等,让用户专注于其他任务。
Q2:这项功能有什么限制和风险?
A:目前该功能仅支持Mac计算机,不支持Windows或Linux。功能仍处于早期阶段,Claude可能会犯错误,复杂任务需要多次尝试,基于屏幕的操作比直接API集成慢。此外存在安全风险,可能使计算机容易受到网络攻击,建议避免访问敏感数据。
Q3:如何使用Claude的计算机控制功能?
A:该功能作为研究预览版向Claude Pro和Max订阅用户开放。系统采用权限优先方法,Claude在接触新应用程序前会请求访问权限,用户可随时停止操作。可与移动工具Dispatch配合使用,用户从智能手机分配任务给Claude完成。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。