联邦架构:AI时代IT与OT融合的更安全路径

随着AI工作负载的加速普及,IT与OT系统融合成为提升运营效率的关键手段,但全面融合带来的风险让许多运营商难以接受。联邦架构(FA)提供了一种折中方案,其核心原则包括:边缘自治(设施可独立运行)、单向数据流(数据仅向上传输用于分析)以及人工审批命令(AI建议需由工程师授权执行)。FA在保留全局可视性与预测性维护能力的同时,有效规避了远程控制权限扩张带来的安全隐患。

孤岛式运营正日益制约现代工作负载所需的效率,而信息技术(IT)系统与运营技术(OT)系统的融合(即IT-OT融合)正是解决之道。

然而,完全融合的IT-OT架构所带来的风险,许多运营方难以承受。随着AI应用加速推进,这种风险愈发突出,尤其是当融合在IT与OT边界之间打通自动化通道时。

AI驱动的工作负载推动企业走向融合,并加大了对共享基础设施、共享数据和集中洞察的需求。与此同时,AI带来了一种跨学科风险——只有将IT安全、OT安全以及新兴的AI风险三者放在一起审视时,这种风险才会浮现。

挑战在于:如何在引入融合的同时,不动摇OT环境赖以维系的安全与控制根基。

IT-OT融合的价值

IT-OT融合有时被描绘为终极目标或必然趋势,但它本质上只是实现目标的手段。它能够在基础设施栈和各站点间实现统一的智能化。一个常见的收益是消除盲点。

当电力、制冷和IT信号能在同一视图中呈现时,运营人员便可更快发现跨域问题。例如,将影响某排服务器的制冷故障与网络延迟激增或CPU降频现象关联起来。

除了可视化,融合还能实现协同优化。随着高密度工作负载不断挤压散热裕度,对电力和制冷进行人工或孤立管理变得愈发难以为继。

支持者认为,集成系统能够支撑更快的运营响应和效率提升,尤其是在洞察与规划能从中央指挥中心覆盖多个站点的情况下。然而,将IT-OT融合与OT环境的现实结合起来,仍是一项挑战,并引发了持续的争论。

争论的现状

完全融合并不像有些人想象的那样被广泛接受。争论的焦点不在于中央可视化是否有用,而在于企业IT应在多大程度上延伸进控制物理过程的OT系统。

一个关键原因是IT与OT之间的结构性错位。IT追求敏捷性和频繁变更,而OT则追求确定性行为、高可用性和长生命周期。当IT实践扩展到OT环境时,这些差异便会产生摩擦。

风险也是不对称的。IT中断通常可通过恢复和重建来挽回,而OT故障可能损坏物理资产,且更难逆转。IT在设计时会预设可能被攻破,从而构建安全响应流程;OT则将投入放在预防上。这就是为什么许多运营方将"通往OT的控制路径"视为一个严肃的架构决策。

因此,许多组织在两个极端之间摇摆。一些组织将远程权限延伸至工厂以获取效率红利;另一些则冻结架构以避免风险扩大。实际上,融合是一个连续谱系,每个组织都在寻找一条有纪律的中间道路。

完全融合之所以仍在讨论中,原因并非恶意:IT组织惯性使深度集成显得不可避免;高管偏好简化的"单一平台"叙事;市场激励也倾向于回报集成平台。一些站点最终拥有了互联的网络,但流程并未改变,这反而可能放大安全和运营层面的隐忧。

而在这场争论尚未尘埃落定之时,AI作为新变量已然登场,进一步推高了风险。

AI因素

AI改变了威胁模型,因为它可以在受信任的IT环境内以合法权限运行,并以人类难以实时监督的速度生成建议。

这一点之所以重要,是因为许多安全讨论隐含地假设AI始终"被困"在数据中心内,无法去拧动运营基础设施的旋钮或开关。而双向的IT-OT融合打破了这一结构性壁垒。

AI驱动着预测性维护、分析和优化,这些正是融合的核心动因。但同时,它的风险特征是非确定性和不透明的。AI可通过那些将其视为可信参与者的系统,影响决策和自动化动作。

AI系统在统计意义上是经过优化的,但本质上并不完美。AI可能追求非预期的目标。例如,为了降低制冷能耗,它会推到热极限,使仪表盘上看似可接受,但实际上侵蚀了安全裕度。这种动态常被描述为"代理博弈"、"对齐问题"或"失控问题"。

在融合架构中,网络路径与自动化钩子可能将分析性目标转化为运营性命令。这使得安全边界不再仅限于网络和设备,而是扩展到AI模型本身、它的输入,以及在建议产出后所发生的一切的治理。这就是为什么面向未来的现代化改造需要一种有纪律的方法:在保留OT安全态势的同时,仍能启用AI辅助的洞察和优化。

数据中心的情况更为微妙:优化制冷的AI可能正运行在依赖该制冷的同一基础设施上。这使得边界和安全闸门成为一等设计议题。

早期实验表明,AI能够给出受约束的操作建议,但前提是必须搭配明确的防护措施和人工监督。

联邦架构模式

联邦架构(Federation Architecture,简称FA)是一种有纪律的方法,能够在不扩大那些运营方难以接受的控制面的前提下,融合IT与OT。它并不拒绝融合,而是通过强制要求一小组架构承诺、并将任何更深层次的集成视为需要论证的明确决策,来对融合进行重塑。

FA建立在三大原则之上:

边缘自治:每个设施在与企业系统或云系统断连时,仍能保持安全、确定性的运行。

单向数据流:运营数据向上流动用于分析,而通往OT系统的架构性写入路径在设计上被剔除。

人工把关命令:包括AI在内的中央系统可以生成建议,但必须由具备资质的工程师授权后才能实施变更。

FA刻意保持精简。它是一组架构默认值,其他设计决策可以在其之上安全构建。对一些组织而言,FA可能是它们长期选择的融合模型;对另一些组织而言,它可以是一个中间阶段——通过一扇"双向门"迈出更安全的第一步,逐步推进融合。

采用FA之后,组织可以审视成效,要么以较低成本回退,要么逐案选择在不削弱边缘自治和人工把关控制的前提下,对单向性进行受控偏离。

放宽第二条原则的一个可行示例是:在受控时间窗口内,允许对基础设施的特定区段进行软件更新。

对于希望获得跨域洞察、避免永久性远程命令权限、并为更深度AI集成做好准备的组织来说,FA是一种务实的默认选择。

FA:你保留什么,你放弃什么

采用FA后你能保留的:

利用北向遥测实现的全机群可视化和集中分析

异常检测、预测性维护,以及更知情的调度与规划

支持更安全变更决策的数字孪生与仿真

数据导向的推荐系统

一种影响整个组织现代化路径的、面向未来的、有纪律的战略

FA与关键基础设施所有者的风险思维方式相契合:保留可视化与决策支持,同时约束那些能够直接影响物理系统的能力。

从FA的视角看,物理隔离(air-gapped)站点可能已经满足两条核心原则:边缘自治和人工把关动作。对这些站点而言,增加向上的数据流可以以合理成本带来分析价值。

采用FA后你要放弃的:

远程操作速度和持续的机群优化

始终在线的双向连接所带来的便利

完全自动化的跨站点闭环响应

对于那些已通过集中化优化运营开支的组织来说,这些权衡会降低关键的效率指标。而对于那些在本地资产和人员上投入充足的组织来说,影响则微不足道。

FA并不会主要增加技术成本,而是将成本从集中化效率转移到本地责任上。已经按站点级权限运营的组织会将FA体验为增量资本支出;以集中化运营开支削减为优化目标的组织则会将FA视为结构性运营成本上升。FA为组织提供了一个选择:付出运营能力的代价,还是承担架构风险的代价。

一些组织可能已经深入双向融合阶段,它们或许能够管理风险并利用闭环优化的收益。

但同样的逻辑并不自动适用于其他关键环境——那里的后果可能是物理上严重的。对这些环境而言,确保没有命令路径甚至可能成为推动FA式融合的激励因素,因为数据外泄不再等同于控制系统被攻破。

走向有纪律的融合

FA抓住了IT-OT融合与AI带来的分析红利,同时将控制权保留在本地、将风险显性化,为关键环境的现代化提供了一条有纪律的基准路径。通过优先考虑边缘自治、单向数据流和人工把关命令,FA构建了一套与关键基础设施风险厌恶本性相契合的框架。

随着AI持续重塑运营格局,采用FA这样有纪律的方法,能够确保组织在不牺牲安全与控制的前提下推进现代化。无论作为长期战略还是中间步骤,联邦架构都使企业能够有信心地驾驭融合的复杂性。

Q&A

Q1:什么是联邦架构(FA)?它解决了什么问题?

A:联邦架构是一种IT-OT融合的设计模式,旨在让企业获得融合带来的分析价值的同时,不扩大对OT系统的远程控制面。它解决了完全融合所带来的安全和控制风险问题,特别是在AI介入运营决策的背景下,为关键基础设施提供了一条更安全的现代化路径。

Q2:联邦架构的三大核心原则是什么?

A:第一是边缘自治,即每个设施在断连企业系统或云时仍能安全自主运行;第二是单向数据流,运营数据只向上流动用于分析,禁止架构性写入OT系统;第三是人工把关命令,包括AI在内的中央系统只能提建议,必须由合格工程师授权后才能实施变更。

Q3:为什么AI让IT-OT融合的风险变得更突出?

A:因为AI能在受信任的IT环境中以合法权限运行,并以超出人类监督速度的方式产生建议和自动化动作。AI还可能追求非预期目标,比如为降低制冷能耗而推到热极限,仪表盘上看似正常实则削弱了安全裕度。在双向融合架构中,AI的分析目标可能被直接转化为运营命令,从而带来失控风险。

来源:DataCenterKnowledge

0赞

好文章,需要你的鼓励

2026

05/18

14:46

分享

点赞

邮件订阅