本报告汇总了在德国、荷兰和法国与政府高级政策制定者开展的三场桌面推演(TTX)的主要发现。这一系列推演由兰德欧洲研究院、英国AI安全研究所与魁北克AI研究院Mila联合开展,以2026年国际AI安全报告为基础,旨在帮助高级官员切实应对新兴人工智能风险所带来的挑战。
推演采用兰德的"次日"方法论,每场会议安排15至20名高级官员扮演内阁成员角色,分两轮应对一场模拟的AI驱动网络安全危机。场景围绕"FlowGPT"展开——这是一个虚构的政府支持的前沿AI模型,被犯罪分子大规模利用于网络攻击。第二轮则引入了一个具有同等能力但几乎没有安全限制的开放权重竞争模型,使得第一轮中可用的治理手段在此失效。
在三场推演中,与会者的讨论集中在以下六个核心议题:
危机门槛的界定
AI驱动的网络攻击在何种规模和速度下,才构成国家层面的危机,而非常规运营问题?
如何应对国家支持的AI开发商
在推演场景中,政府曾公开背书并资助了问题模型的开发方。若要对其采取行动,意味着承认治理失职,并承受放弃战略资产所带来的政治与经济代价。
能力无法可靠评估时的风险管理
由于缺乏独立评估模型风险的可信手段,政府只能依赖开发方自愿提供的风险评估,而这些评估本身可能存在利益偏差。
防范开放权重模型的滥用
第二轮中高能力开放权重模型的扩散带来了新的挑战,因为对此类模型实施监控和防护措施的难度更大。
关键基础设施的加固
保护脆弱系统的方案从限制对AI模型的访问,到模拟针对关键系统的攻击,建议多样。
将危机转化为推动制度建设的契机
危机带来了关注度、资源和政治意愿,这些都可用于投资长效的应急准备措施。
与盟国的协调合作
是将威胁情报限定在可信的小多边网络内共享,还是广泛披露信息——包括向潜在对手披露——这一抉择贯穿推演始终。
Q&A
Q1:桌面推演采用的"次日"方法论是什么?
A:兰德的"次日"方法论是一种情景模拟技术,将参与者置于危机已经发生后的情境中,要求他们以决策者身份应对后续挑战。在本次推演中,15至20名高级官员扮演内阁成员,分两轮应对AI驱动的网络安全危机,通过模拟真实决策过程,帮助官员提前识别治理盲点和应对短板。
Q2:开放权重AI模型在网络安全领域有哪些具体风险?
A:开放权重模型的核心风险在于其难以被监控和管控。由于模型权重公开,任何人都可以在没有安全限制的情况下使用或修改它。推演中,第二轮引入的开放权重模型与FlowGPT能力相当,但几乎没有安全约束,这使得政府在第一轮中可用的治理手段完全失效,无法通过向开发商施压来控制风险扩散。
Q3:政府在应对AI驱动的网络危机时面临哪些治理困境?
A:主要困境有两点:一是当政府曾公开支持某AI模型开发商时,对其采取管控措施意味着承认自身的治理失败,需承担政治和经济双重代价;二是在缺乏独立评估手段的情况下,政府只能依赖开发商自愿提交的风险报告,而这些报告可能存在利益偏向,导致风险管理决策缺乏可靠依据。
好文章,需要你的鼓励
在2026年爱迪生电气协会年会上,共和党籍佐治亚州长肯普与民主党籍亚利桑那州长霍布斯罕见达成共识:数据中心带来的电网扩容成本不应转嫁给普通居民。两位州长均支持"增长自付"原则,并倡导多元化能源组合。肯普强调核电与冻结居民电费,霍布斯则推动取消数据中心税收豁免并征收水费。两人跨越党派分歧的一致立场,折射出美国电力行业应对数据中心爆发式增长的主流方向。
这项研究系统比较了四种AI图像分词策略在640000张星系图像上的表现,发现重建质量与物理属性预测能力之间存在根本性解耦,为天文基础模型的分词器选择提供了实验依据。
北美电网今夏首次无高风险区域,NERC评估显示58GW新增资源使各地储备充足。然而业内专家普遍警告,这不过是暂时喘息:数据中心并网延迟、太阳能与储能主导新增供应、劳动力短缺、融资困难及气候依赖性上升等问题依然严峻。预计未来两三年内,延迟的数据中心负荷将集中上线,电力系统将面临更大压力,并购整合浪潮也在加速重塑行业格局。
阿里Qwen团队研究如何将大模型的规模化训练思路迁移到机器人操作领域,通过统一多机器人表示与38100小时数据预训练,让机器人在陌生场景和陌生机型上也能完成复杂操作任务。