Anthropic今天宣布为Claude Code推出全新的"自动模式",该模式让大语言模型能够在AI安全防护机制下做出权限级别的决策。该公司表示,这将比开发者在长时间编程会话中使用的"危险跳过权限"选项更加安全。
Claude Code功能极其强大,不仅能编写代码,还能执行编程人员所需的shell命令来产生结果。这些命令包括创建目录、移动文件、向GitHub提交更新等,甚至包括删除文件和目录。
由于让AI在计算机上肆意运行是一个可怕的前景,Claude实施了多种权限系统。其中一种保护措施将Claude限制在指定的文件夹层次结构中工作。例如,这意味着它只能处理Xcode项目,但无法访问主要的Documents文件夹或其他文件。
这种保护措施可以防止系统范围的灾难,但无法防止Claude破坏整个代码库。事实上,它确实发生过这样的情况。定期备份至关重要。
另一个保护机制是Claude会对任何可能有问题的操作请求权限,特别是所有shell命令。虽然这对保护很有好处,但对生产力却是残酷的打击。你无法让Claude自由编写代码然后午餐后回来查看结果,而是必须逐一批准每个命令,非常繁琐。
Claude提供了权限等级,你可以设置自己感到舒适的级别。由于程序员就是程序员,甚至还有一个极端选项,叫做"危险跳过权限",它会跳过权限检查,令人意外的是,这确实很危险。
正如你可能想象的那样,这里存在一个艰难的权衡。要么让Claude停止工作,每隔几分钟打断你一次,要么让Claude自由发挥,这可能涉及构建令人惊叹的东西或破坏数月的工作成果。
这就是Claude Code新自动模式的用武之地。目前还不要太兴奋,现在它只是一个研究预览版,仅对Team计划用户开放。公司表示,它将在"未来几天"面向Enterprise计划和API用户推出。
"自动模式是一个中间道路,让你能够以较少的中断运行更长的任务,同时比跳过所有权限引入更少的风险,"该公司表示。"在每次工具调用运行之前,分类器会审查它,检查潜在的破坏性操作,如大量删除文件、敏感数据泄露或恶意代码执行。"
公司表示,分类器认为安全的操作会自动进行,而有风险的操作会被阻止,促使Claude采取不同的方法。如果Claude坚持执行持续被阻止的操作,最终会向用户触发权限提示。
新的自动模式分类器会寻找潜在的风险命令,如大量文件删除、敏感数据泄露和恶意执行。公司表示风险已降低,但并未完全消除。它仍然强烈建议在隔离环境中工作。
与所有AI活动一样,自动模式可能会出现混乱。如果AI没有正确理解上下文,一些有风险的操作可能被允许执行。良性操作有时可能会被阻止。
这似乎不完全像是监守自盗的情况,添加额外的护栏是有意义的。然而,自动模式感觉像是拆除护栏,同时在路边竖起一块写着"陡峭悬崖"的标志。
目前,Claude 0/月的Max计划无法使用此功能。但必须承认,当只想让Claude完成工作时,对Claude坚持进行权限审查感到非常沮丧。
定期备份机器,所以如果自动模式或危险跳过权限决定地毯式轰炸代码,可以恢复。如果经常使用这些功能中的任何一个,会养成在让AI处理任何事情之前进行目录压缩和额外备份运行的习惯。
写这篇文章时,可能更愿意运行自动模式而不是完全开放的"危险跳过权限"选项。希望获得更高的生产力,但也更愿意有一些护栏到位。所以,当它对我的计划可用时,很可能会尝试一下。
目前,自动模式功能与Sonnet 4.6和Opus 4.6模型兼容。同样,在发布时仅对Teams用户可用。Anthropic表示,"自动模式可能对工具调用的Token消耗、成本和延迟有小的影响。"
这种方法随着时间的推移会得到改善。毕竟,Claude Code才刚刚一岁,在这段时间里它极大地改变了编程世界。在这段时间里,它也取得了突飞猛进的改进。
因此,虽然自动模式让编程人员在便利性和计算开销之间做出权衡,但一旦成熟,它很可能成为整体开发堆栈的一部分。
Q&A
Q1:Claude Code的自动模式是什么功能?
A:自动模式是Claude Code的新功能,它让大语言模型能在AI安全防护下自主做权限决策。相比完全跳过权限检查,它提供了更安全的选择,减少了编程过程中的频繁中断,同时通过分类器检查潜在破坏性操作。
Q2:自动模式如何平衡安全性和效率?
A:自动模式通过分类器在每次工具调用前进行审查,自动允许安全操作执行,阻止风险操作如大量删除文件、敏感数据泄露等。如果Claude坚持执行被阻止的操作,会最终触发用户权限提示,实现安全与效率的平衡。
Q3:谁可以使用Claude Code的自动模式?
A:目前自动模式仅作为研究预览版提供给Team计划用户,与Sonnet 4.6和Opus 4.6模型兼容。Anthropic表示将在未来几天向Enterprise计划和API用户推出,Max计划用户暂时无法使用。
好文章,需要你的鼓励
Insta360推出GO 3S复古套装,将现代4K运动相机与胶片时代美学结合。套装核心仍是仅重39克的GO 3S,新增复古取景器、胶片风格滤镜、NFC定制外壳及可延长录制时长至76分钟的电池组。复古取景器模仿老式腰平相机设计,鼓励用户放慢节奏、专注构图。相机内置11种色彩预设及负片、正片等滤镜,同时保留FlowState防抖、4K拍摄及10米防水能力,面向热衷复古影像风格的年轻创作者。
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
谷歌近期悄然调整账户存储政策:新注册用户若未绑定手机号,免费存储空间将从原来的15GB缩减至5GB。用户需验证手机号后,方可获得完整的15GB空间,用于Gmail、Drive和Photos的共享使用。谷歌表示,此举旨在确保存储空间"每人仅限一份",有效防止滥用。有分析认为,存储硬件成本上升也是推动此次政策调整的重要原因之一。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。