欧洲AI安全与网络滥用桌面推演的核心洞察

本报告呈现了在德国、荷兰和法国与政府高级决策者开展的三次桌面演练(TTX)成果。演练由RAND欧洲、英国AI安全研究所及米拉魁北克AI研究所联合设计,以2026年国际AI安全报告为基础。采用RAND"次日"方法论,每场演练让15至20名高级官员扮演内阁成员,应对AI驱动的网络安全危机。核心议题涵盖危机阈值界定、国家AI资产治理、开源模型滥用防范、关键基础设施加固及盟友情报共享等六大方向。

本报告汇总了在德国、荷兰和法国与政府高级政策制定者开展的三场桌面推演(TTX)的主要发现。这一系列推演由兰德欧洲研究院、英国AI安全研究所与魁北克AI研究院Mila联合开展,以2026年国际AI安全报告为基础,旨在帮助高级官员切实应对新兴人工智能风险所带来的挑战。

推演采用兰德的"次日"方法论,每场会议安排15至20名高级官员扮演内阁成员角色,分两轮应对一场模拟的AI驱动网络安全危机。场景围绕"FlowGPT"展开——这是一个虚构的政府支持的前沿AI模型,被犯罪分子大规模利用于网络攻击。第二轮则引入了一个具有同等能力但几乎没有安全限制的开放权重竞争模型,使得第一轮中可用的治理手段在此失效。

在三场推演中,与会者的讨论集中在以下六个核心议题:

危机门槛的界定

AI驱动的网络攻击在何种规模和速度下,才构成国家层面的危机,而非常规运营问题?

如何应对国家支持的AI开发商

在推演场景中,政府曾公开背书并资助了问题模型的开发方。若要对其采取行动,意味着承认治理失职,并承受放弃战略资产所带来的政治与经济代价。

能力无法可靠评估时的风险管理

由于缺乏独立评估模型风险的可信手段,政府只能依赖开发方自愿提供的风险评估,而这些评估本身可能存在利益偏差。

防范开放权重模型的滥用

第二轮中高能力开放权重模型的扩散带来了新的挑战,因为对此类模型实施监控和防护措施的难度更大。

关键基础设施的加固

保护脆弱系统的方案从限制对AI模型的访问,到模拟针对关键系统的攻击,建议多样。

将危机转化为推动制度建设的契机

危机带来了关注度、资源和政治意愿,这些都可用于投资长效的应急准备措施。

与盟国的协调合作

是将威胁情报限定在可信的小多边网络内共享,还是广泛披露信息——包括向潜在对手披露——这一抉择贯穿推演始终。

Q&A

Q1:桌面推演采用的"次日"方法论是什么?

A:兰德的"次日"方法论是一种情景模拟技术,将参与者置于危机已经发生后的情境中,要求他们以决策者身份应对后续挑战。在本次推演中,15至20名高级官员扮演内阁成员,分两轮应对AI驱动的网络安全危机,通过模拟真实决策过程,帮助官员提前识别治理盲点和应对短板。

Q2:开放权重AI模型在网络安全领域有哪些具体风险?

A:开放权重模型的核心风险在于其难以被监控和管控。由于模型权重公开,任何人都可以在没有安全限制的情况下使用或修改它。推演中,第二轮引入的开放权重模型与FlowGPT能力相当,但几乎没有安全约束,这使得政府在第一轮中可用的治理手段完全失效,无法通过向开发商施压来控制风险扩散。

Q3:政府在应对AI驱动的网络危机时面临哪些治理困境?

A:主要困境有两点:一是当政府曾公开支持某AI模型开发商时,对其采取管控措施意味着承认自身的治理失败,需承担政治和经济双重代价;二是在缺乏独立评估手段的情况下,政府只能依赖开发商自愿提交的风险报告,而这些报告可能存在利益偏向,导致风险管理决策缺乏可靠依据。

来源:Rand

0赞

好文章,需要你的鼓励

2026

07/01

17:58

分享

点赞

邮件订阅