AI基础设施供应商正在突破服务器和冷却系统的传统边界,数据中心正在演变为公用事业级规模的超大型园区。西门子于近日发布了一套与英伟达、Fluence、Vertiv及其他合作伙伴共同开发的参考架构,该架构将电气基础设施、电池储能系统(BESS)、液冷技术以及英伟达即将推出的Vera Rubin平台整合为一体。
西门子表示,此次发布的参考架构旨在为运营商提供一套经过验证的大规模AI园区建设蓝图,同时降低工程复杂度和部署风险。该参考架构将在总容量136MW的设施中支持100MW的IT负载。除计算基础设施外,该设计还融入了西门子的电气系统、Fluence的电池储能技术以及Vertiv的液冷方案。
AI工厂与传统数据中心的分野
Dell'Oro Group研究总监Alex Cordovil表示,此次发布清晰地展现了AI基础设施与传统数据中心设计之间日益扩大的差距。
"这并非对传统数据中心的渐进式升级,而是确认了AI工厂已成为一种独立的设施类别——其架构从端到端围绕计算平台进行工程设计,而非由各自优化的供电和冷却系统拼装而成。"他在接受Data Center Knowledge采访时如此表示。
Cordovil将这一趋势描述为传统数据中心与围绕英伟达Vera Rubin NVL72等平台专门构建的AI工厂之间的"分叉"。他补充道:"值得关注的是,这首先是一套电源、电气和控制架构,先进冷却作为补充随后跟进——这个顺序本身才是真正的信号。"
"当前制约AI基础设施的核心瓶颈是电力供应和电网接入,而非冷却能力。在电力受限的站点中内置电池层,用于平滑AI负载并应对电网事件,这一设计明确揭示了这一现实。"
从变电站向内延伸的整体设计
西门子的架构设计涵盖了从公用事业互联和中压配电,到设施控制、电气保护系统、储能系统,再到AI计算的全链路。随着AI集群规模的不断扩大,运营商需要管理的远不止服务器和冷却系统。公用电力服务、电能质量、系统韧性以及电气配电,正在成为以数十乃至数百兆瓦为量级的大型设施的核心设计要素。
该架构的规模反映了这一转变——IT负载100MW、总容量136MW的设计,所针对的部署场景在用电需求上已愈发接近工业设施。据西门子介绍,该架构旨在提供一套可复制的部署模型,帮助运营商缩短规划周期、降低集成风险。
在这套蓝图中,电池储能所扮演的角色远超传统备用电源的范畴。Fluence表示,其Smartstack平台旨在支持电压和频率穿越、黑启动、需求响应以及AI负载平滑等功能,将储能定位于支撑电网交互、提升系统韧性和应对工作负载波动,而非单纯作为备用电源使用。
电池储能与配电、控制及冷却系统的协同整合,深刻揭示了能源基础设施正在成为AI设施运营中愈发活跃的核心组成部分。
AI基础设施的工业化进程
此次发布同样折射出英伟达围绕"AI工厂"概念构建生态系统的战略意图。过去数年间,英伟达已通过合作伙伴体系,从GPU和服务器领域逐步延伸至网络、冷却、电力以及设施级集成。
"更深层的转变是工业化。"Cordovil说道,"预制化、工厂测试完成的模块化构件,可将规模从数十兆瓦扩展至数百兆瓦,竞争焦点也因此转向了投产速度和执行风险,而非定制化工程能力。"
不断攀升的功率密度正在加速这一转变。Omdia首席分析师Roy Illsley在接受Data Center Knowledge采访时表示:"我们正在看到,功率密度的提升意味着架构必须随之演进,而我们已经到达一个临界点——新架构已无法在旧架构基础上升级改造。"
随着运营商持续推进更大规模AI园区的建设,整个行业正面临一个支撑西门子新架构逻辑的核心现实:支撑AI工作负载的基础设施,其战略重要性已与计算系统本身不相上下。
Q&A
Q1:西门子发布的AI工厂参考架构具体包含哪些内容?
A:西门子联合英伟达、Fluence、Vertiv等合作伙伴发布的参考架构,整合了电气基础设施、电池储能系统(BESS)、液冷技术以及英伟达Vera Rubin平台。该架构支持100MW的IT负载,总设施容量为136MW,覆盖从公用事业互联、中压配电到设施控制、电气保护和AI计算的全链路,旨在为大规模AI园区建设提供可复制的部署蓝图,帮助运营商降低工程复杂度和部署风险。
Q2:AI工厂和传统数据中心有什么本质区别?
A:AI工厂是围绕计算平台从端到端进行工程设计的独立设施类别,而非由各自优化的供电和冷却系统拼装而成。与传统数据中心相比,AI工厂将电力供应和电网接入视为核心瓶颈,电气架构优先于冷却系统设计。此外,AI工厂的功率密度持续攀升,现有架构已无法在旧架构基础上升级,必须进行整体性重新设计,其规模和复杂度愈发接近工业设施。
Q3:电池储能系统在AI数据中心中扮演什么角色?
A:在西门子的参考架构中,电池储能系统的作用远超传统备用电源范畴。Fluence的Smartstack平台可支持电压和频率穿越、黑启动、需求响应以及AI负载平滑等多项功能,能够主动参与电网交互、提升系统韧性,并应对AI工作负载带来的功率波动,成为AI设施运营中不可或缺的能源基础设施组成部分。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
伊尔德兹技术大学团队通过词典手术和离线蒸馏,以不足20美元成本打造出专为土耳其语优化的200M参数句子嵌入模型,在语义相似度任务上超越了参数量更大的原版教师模型。