一个Discord群组已访问Mythos模型长达两周。
Anthropic旗下一款强大的网络安全工具——Mythos AI模型,被该公司认为若落入不当之手将造成严重危险,如今已遭"一小群未经授权的用户"访问。据彭博社报道,一名仅被描述为"Anthropic第三方承包商"的匿名成员透露,一个私密线上论坛的成员综合利用了该承包商的访问权限与"常见的网络侦察工具",成功入侵了Mythos系统。
Claude Mythos Preview是一款全新的通用模型,据Anthropic官方介绍,该模型在用户指令下能够识别并利用"几乎所有主流操作系统和主流浏览器中的漏洞"。目前,该模型的正式访问权限仅通过"Project Glasswing"计划向少数企业开放,包括英伟达、谷歌、亚马逊云服务(AWS)、苹果和微软,多国政府也在密切关注这项技术。出于对该模型可能被恶意利用的担忧,Anthropic目前没有公开发布的计划。
对此,Anthropic发言人在向彭博社提供的声明中表示:"我们正在调查一份报告,该报告称有人通过我们某第三方供应商环境对Claude Mythos Preview进行了未授权访问。"Anthropic目前尚无证据表明此次未授权访问已影响到公司自身系统,或超出该第三方供应商环境的范围。
据报道,此次非法访问发生于4月7日,恰好是Anthropic宣布向有限数量的企业开放Mythos测试的当天。实施未授权访问的群体目前尚未被公开披露,但彭博社报道称,其成员活跃于一个专门收集未发布AI模型相关信息的Discord频道。
该群体通过利用从近期Mercor数据泄露事件中获取的Anthropic其他模型格式信息,对模型的在线存储位置进行了"有根据的猜测",从而成功访问了Mythos。自获得访问权限以来,成员们一直在频繁使用该模型,并向彭博社提供了截图及实时演示作为证明,但据称为规避Anthropic的检测,他们并未将其用于网络安全相关用途。彭博社还称,该群体还访问了Anthropic其他尚未发布的AI模型。
Q&A
Q1:Claude Mythos Preview是什么模型,有哪些能力?
A:Claude Mythos Preview是Anthropic开发的全新通用AI模型,专注于网络安全领域。据Anthropic官方介绍,该模型能够在用户指令下识别并利用几乎所有主流操作系统和主流浏览器中的安全漏洞。正因其强大且潜在的危险性,Anthropic目前仅通过Project Glasswing计划向英伟达、谷歌、亚马逊云服务、苹果和微软等少数企业开放访问权限,暂无公开发布计划。
Q2:未授权用户是如何入侵Mythos模型的?
A:据彭博社报道,这群用户综合运用了多种手段:一方面借助一名Anthropic第三方承包商的访问权限;另一方面利用近期Mercor数据泄露事件中获取的Anthropic其他模型格式信息,对Mythos的在线存储位置进行了"有根据的猜测",并配合常见网络侦察工具,最终于4月7日成功获得了未授权访问。
Q3:Anthropic对此次未授权访问事件的回应是什么?
A:Anthropic发言人确认正在调查该事件,声明称此次疑似未授权访问发生在第三方供应商环境中。目前Anthropic尚无证据表明公司自身系统受到影响,或此次访问已超出第三方供应商环境的范围。调查仍在进行中。
好文章,需要你的鼓励
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
谷歌在Android Show发布会上宣布,将Gemini更深度整合至Android系统,推出名为"Gemini Intelligence"的升级功能。该功能可跨应用处理日常任务,包括自动填写表单、安排日程、生成购物清单及自定义小组件等,无需用户频繁切换应用。此外,Gboard新增"Rambler"功能,可自动过滤语音输入中的口误和填充词。Gemini Intelligence将率先登陆三星Galaxy和谷歌Pixel手机,并支持Android Auto、Wear OS及智能眼镜。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。