Anthropic公司指控三家中国人工智能企业通过创建超过2.4万个虚假账户来窃取其Claude AI模型的技术,以改进自己的模型性能。
被指控的企业包括深度求索(DeepSeek)、月之暗面(Moonshot AI)和MiniMax。据称,这些实验室通过虚假账户与Claude进行了超过1600万次对话交互,使用了一种名为"蒸馏"的技术手段。Anthropic表示,这些实验室"专门针对Claude最具差异化的核心能力:智能体推理、工具使用和编程能力"。
这一指控正值美国政府就是否严格执行先进AI芯片出口管制政策展开辩论之际,该政策旨在遏制中国人工智能发展。
蒸馏技术是AI实验室用于训练自己模型的常见方法,可以创建更小、更便宜的模型版本,但竞争对手也可以利用这种技术来复制其他实验室的成果。本月早些时候,OpenAI向众议院议员发送备忘录,指控深度求索使用蒸馏技术模仿其产品。
深度求索一年前首次引起关注,当时发布了开源的R1推理模型,以极低的成本实现了接近美国前沿实验室的性能表现。据报道,深度求索即将发布其最新模型DeepSeek V4,该模型在编程能力方面据称能够超越Anthropic的Claude和OpenAI的ChatGPT。
每次攻击的规模和范围各不相同。Anthropic追踪到来自深度求索的超过15万次交互,这些交互似乎旨在改进基础逻辑和一致性,特别是围绕政策敏感查询的审查安全替代方案。
月之暗面进行了超过340万次交互,主要针对智能体推理和工具使用、编程和数据分析、计算机使用智能体开发以及计算机视觉。上个月,该公司发布了新的开源模型Kimi K2.5和一个编程智能体。
MiniMax的1300万次交互针对智能体编程、工具使用和编排功能。Anthropic表示,当最新Claude模型发布时,他们能够观察到MiniMax将近一半的流量重新定向以窃取该模型的能力。
Anthropic表示将继续投资防御措施,使蒸馏攻击更难执行且更容易识别,但呼吁"AI行业、云服务提供商和政策制定者协调响应"。
这些蒸馏攻击发生在美国对华芯片出口仍然激烈辩论的时期。上个月,特朗普政府正式允许英伟达等美国公司向中国出口先进AI芯片(如H200)。批评人士认为,这种出口管制的放松在全球AI主导地位竞争的关键时期增强了中国的AI计算能力。
Anthropic指出,深度求索、MiniMax和月之暗面进行的大规模提取"需要获得先进芯片"。
Anthropic在其博客中写道:"因此,蒸馏攻击强化了出口管制的合理性:限制芯片获取既限制了直接模型训练,也限制了非法蒸馏的规模。"
智库Silverado Policy Accelerator主席、CrowdStrike联合创始人德米特里·阿尔佩罗维奇告诉TechCrunch,他对看到这些攻击并不感到惊讶。
阿尔佩罗维奇说:"很久以来,中国AI模型快速进步的部分原因显然是通过蒸馏技术窃取美国前沿模型。现在我们确实知道了这个事实。这应该给我们更充分的理由拒绝向这些公司销售任何AI芯片,否则只会让他们获得更多优势。"
Anthropic还表示,蒸馏技术不仅威胁削弱美国AI主导地位,还可能带来国家安全风险。
Anthropic在博客文章中写道:"Anthropic和其他美国公司构建的系统可以防止国家和非国家行为者使用AI来开发生物武器或进行恶意网络活动。通过非法蒸馏构建的模型不太可能保留这些安全保障,这意味着危险能力可能会在完全剥离许多保护措施的情况下扩散。"
Anthropic指出,专制政府将前沿AI部署用于"攻击性网络行动、虚假信息活动和大规模监控"等活动,如果这些模型开源化,这种风险会成倍增加。
TechCrunch已联系深度求索、MiniMax和月之暗面征求意见。
Q&A
Q1:什么是AI模型蒸馏技术?为什么会被用来窃取技术?
A:蒸馏技术是AI实验室用于训练自己模型的常见方法,可以创建更小、更便宜的模型版本。但竞争对手也可以利用这种技术来复制其他实验室的成果,通过大量与目标模型的对话交互来学习和模仿其能力,相当于"抄作业"。
Q2:中国AI企业是如何窃取Claude技术的?规模有多大?
A:三家中国AI企业通过创建超过2.4万个虚假账户,与Claude进行了超过1600万次对话交互。其中深度求索进行了15万次交互,月之暗面340万次,MiniMax达到1300万次,主要针对智能体推理、工具使用和编程等核心能力。
Q3:这种技术窃取会带来哪些安全风险?
A:除了威胁美国AI主导地位外,还可能带来国家安全风险。通过非法蒸馏构建的模型不太可能保留原有的安全保障措施,可能被用于开发生物武器、恶意网络活动、虚假信息活动和大规模监控等危险用途。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。