Anthropic推出玻璃翼项目,用AI防护AI网络攻击
亚马逊、苹果、谷歌等公司将使用Claude模型来增强其软件防护能力。
我们经常看到关于人工智能潜在负面影响的担忧报道,特别是它可能在网络安全方面带来的新问题。Anthropic宣布了一项名为"玻璃翼项目"的新倡议,旨在通过"保护全球最关键软件"免受AI驱动攻击来解决这些担忧。该项目的合作伙伴包括亚马逊云服务、苹果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux基金会、微软、英伟达和帕洛阿尔托网络公司。
参与者将使用Claude Mythos Preview——Anthropic尚未发布的通用模型——来增强自己的安全项目。Anthropic声称该模型已发现数千个可利用的漏洞,"包括所有主要操作系统和网络浏览器中的一些漏洞"。该公司表示希望开始防御性地使用其工具,以防止恶意使用AI可能对经济和安全造成严重后果。
Anthropic已成为在该领域引发伦理关注的知名AI公司之一。今年早些时候,该公司拒绝为五角大楼移除其服务的安全防护措施,这促使国防部对Anthropic实施"供应链风险"制裁作为报复。推出玻璃翼项目可能是在AI时代改善网络安全的有益开端,但一些损害已经造成。据报道,其自身的Claude在二月份被黑客用于攻击墨西哥多个政府机构。
Q&A
Q1:玻璃翼项目是什么?有哪些公司参与?
A:玻璃翼项目是Anthropic推出的AI网络安全防护倡议,旨在保护全球最关键软件免受AI驱动的网络攻击。参与的合作伙伴包括亚马逊云服务、苹果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux基金会、微软、英伟达和帕洛阿尔托网络公司。
Q2:Claude Mythos Preview模型有什么特殊能力?
A:Claude Mythos Preview是Anthropic尚未发布的通用模型,它已经发现了数千个可利用的安全漏洞,包括所有主要操作系统和网络浏览器中的一些漏洞。参与项目的公司将使用这个模型来增强自己的安全项目。
Q3:Anthropic为什么要推出这个项目?
A:Anthropic希望防御性地使用其AI工具,防止恶意使用AI可能对经济和安全造成严重后果。该公司已成为在AI领域引发伦理关注的知名公司之一,此项目是其在AI时代改善网络安全的重要举措。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。