Anthropic本周表示,其最新模型Mythos的发布范围受到严格限制,原因在于该模型在发现全球用户所依赖的软件安全漏洞方面能力过于强大。
Anthropic并未将Mythos向公众开放,而是选择与亚马逊云服务、摩根大通等负责运营关键网络基础设施的大型企业和机构组成的特定群体共享该模型。据报道,OpenAI也在考虑为其下一款网络安全工具采取类似策略。这一安排的表面逻辑是:让大型企业提前掌握相关能力,从而领先于那些可能利用先进大语言模型入侵安全软件的恶意行为者。
然而,这背后可能远不止网络安全这一层考量,或许还有对模型能力的刻意渲染。
AI网络安全实验室Irregular的CEO Dan Lahav在Mythos发布前的三月份接受TechCrunch采访时表示,尽管AI工具发现漏洞的能力固然重要,但任何漏洞对攻击者的实际价值,取决于多种因素,包括这些漏洞能否被组合利用。
"我脑子里始终有一个问题,"Lahav说,"他们找到的东西,是否具有真正可被利用的价值——无论是单独利用,还是作为攻击链的一环?"
Anthropic表示,Mythos在漏洞利用方面的能力远超此前的Opus模型。但Mythos是否真的是网络安全模型领域的终极答案,目前尚无定论。AI网络安全初创公司Aisle称,其团队使用更小的开放权重模型,就能复现Anthropic所声称的Mythos的大部分能力。Aisle团队认为,这些结果表明,网络安全领域并不存在某一个万能的深度学习模型,而是需要根据具体任务来选择合适的工具。
鉴于Opus已被视为网络安全领域的颠覆性产品,前沿实验室将模型发布范围限制在大型机构,还有另一层原因:这为大型企业合同的持续增长创造了飞轮效应,同时也让竞争对手更难通过蒸馏技术来复制其模型——所谓蒸馏,是指利用前沿模型以低成本训练新大语言模型的技术手段。
初创公司exe.dev的软件工程师兼CEO David Crawshaw在社交媒体上直言:"这是一种营销掩护,掩盖的事实是:顶级模型现在已被企业协议锁定,小型实验室再也无法通过蒸馏获取。等到普通用户能用上Mythos的时候,新一代顶级模型又已经变成企业专属了。这种循环有助于维持企业级收入的持续流入(而这才是收入的大头),因为蒸馏公司被迫退居二线。"
这一分析与当前AI生态系统中的趋势高度吻合:前沿实验室在竞相开发规模最大、能力最强的模型,而像Aisle这样依赖多模型策略、并将开源大语言模型(其中许多来自中国,且据称通过蒸馏技术开发)视为竞争优势的公司,则走的是另一条路。
今年,前沿实验室在反蒸馏问题上态度日趋强硬。Anthropic公开披露了其所称的中国企业复制其模型的行为;据彭博社报道,Anthropic、谷歌和OpenAI三家机构还联手合作,专门识别和封堵蒸馏行为。蒸馏技术对前沿实验室的商业模式构成威胁,因为它消解了依靠巨额资本投入进行规模化扩张所带来的竞争优势。因此,封堵蒸馏本身已是势在必行;而选择性发布的策略,更为各实验室提供了一种方式,在企业市场日益成为盈利部署核心的背景下,进一步强化其企业级产品的差异化优势。
Mythos或任何新模型是否真的对互联网安全构成威胁,目前尚无定论,而审慎推进技术落地也是负责任的做法。
截至发稿,Anthropic尚未回应我们关于此次发布决策是否与蒸馏方面的顾虑有关的提问。但可以看出,这家公司或许已经找到了一种聪明的方式——既守护了互联网安全,也守护了自身的商业利益。
Q&A
Q1:Anthropic为什么限制Mythos模型的公开发布?
A:Anthropic官方给出的理由是,Mythos在发现和利用软件安全漏洞方面能力过强,若公开发布可能被恶意行为者滥用,因此仅向亚马逊云服务、摩根大通等关键基础设施运营机构开放。但也有分析人士指出,这背后还有商业考量——限制发布有助于推动大型企业合同签订,同时防止竞争对手通过蒸馏技术低成本复制该模型。
Q2:蒸馏技术为什么让Anthropic这类前沿实验室感到威胁?
A:蒸馏技术允许开发者利用已有的前沿大语言模型,以较低成本训练出性能相近的新模型,这直接削弱了前沿实验室依靠巨额资本投入建立的竞争壁垒。一旦竞争对手能够低价复制顶级模型,前沿实验室的商业模式就会受到冲击。因此,通过限制模型访问权限来防止蒸馏,已成为Anthropic、谷歌、OpenAI等机构的共同策略。
Q3:Mythos真的是目前最强的网络安全AI模型吗?
A:不一定。AI网络安全初创公司Aisle表示,其团队使用更小的开放权重模型就能复现Mythos的大部分能力,这说明并不存在某个万能的网络安全深度学习模型,实际效果高度依赖具体任务场景。Anthropic虽声称Mythos在漏洞利用方面超越了前代模型Opus,但其是否真正构成独一无二的安全威胁,目前尚无充分证据支撑。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。