Anthropic最新发布Claude Code和Cowork AI工具的计算机控制功能,让AI能够自主控制用户电脑执行各种任务。该功能目前仅限于macOS设备作为研究预览版本推出。
新功能可以实现什么
根据Anthropic的公告,这项新功能可以自动打开文件、使用网络浏览器和应用程序,以及运行开发工具,完全"无需任何设置",甚至在用户离开电脑时也能正常工作。
使用限制和要求
这些新功能作为研究预览版向Claude Pro和Max订阅用户开放,目前计算机控制功能仅限于macOS系统。该功能建立在2024年Claude 3.5 Sonnet模型引入的自主功能基础上,现在将这些功能扩展到面向程序员的Claude Code和Cowork智能体中。
要使用此功能,Claude桌面应用程序必须在支持的macOS设备上运行,并与聊天机器人的移动应用程序配对。更新的工作原理是优先使用支持服务的连接器,如Slack和Google Workspace应用程序,但如果没有可用的连接器,仍会通过直接控制浏览器、鼠标、键盘和显示器来执行任务。
安全与权限控制
Anthropic表示,Claude在执行探索、滚动和点击等操作以完成任务之前,"始终会征求用户的明确许可"。
跨设备协作功能
据Anthropic介绍,该功能与Dispatch配合使用效果"特别好"。Dispatch是最近推出的跨设备功能,允许用户通过手机为Claude桌面应用程序分配任务。
技术局限性
不过,这项功能并非完美无瑕。Anthropic在公告博客中表示:"复杂任务有时需要第二次尝试,通过屏幕操作比使用直接集成要慢。我们之所以提早分享这项功能,是因为我们想了解它在哪些方面表现良好,在哪些方面还有不足。"
Q&A
Q1:Claude计算机控制功能目前支持哪些设备?
A:目前这项功能仅支持macOS设备,作为研究预览版本向Claude Pro和Max订阅用户开放。
Q2:Claude如何控制用户的电脑操作?
A:Claude优先使用Slack和Google Workspace等支持服务的连接器,如果没有可用连接器,会直接控制浏览器、鼠标、键盘和显示器来执行任务,但会在操作前征求用户明确许可。
Q3:Claude计算机控制功能有什么局限性?
A:复杂任务有时需要第二次尝试,通过屏幕操作比直接集成要慢,这是目前功能存在的主要局限性。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。