AI数据中心:一个热门却难以定义的术语

随着现代AI技术对数据中心基础设施提出新要求,"AI数据中心"一词使用日益频繁。然而,这一术语的定义仍不清晰,AI数据中心与传统数据中心的区别并不明显。AI数据中心通常具备更大容量、GPU加速硬件、优化网络设备、高效冷却系统等特征,但这些特性并非AI独有。与其投资专门的AI设施,企业或许应考虑改造现有数据中心来支持AI工作负载。

"AI数据中心"这个术语在现代数据中心讨论中出现频率越来越高。考虑到现代AI技术对数据中心及其内部基础设施提出了全新要求,这并不令人意外。

然而,这个术语也可能显得空洞,因为AI数据中心与其他数据中心的具体区别仍不明确。在随意使用这一术语之前——或者假设AI工作负载需要与现有数据中心根本不同的设施之前——澄清这个术语的实际含义非常重要。

什么是AI数据中心?

"AI数据中心"的简短定义是专门为托管AI工作负载而设计的设施。

然而,这个定义并不特别令人满意,因为AI工作负载的需求可能差异很大。因此,没有独特的数据中心特征能够将面向AI的设施与"常规"数据中心区分开来。

此外,直到生成式AI随着2022年ChatGPT的推出而进入主流,很少有人谈论AI数据中心。正是从那时起,媒体开始将AI数据中心作为一种独特类型的数据中心进行讨论。在此之前,其他类型的AI工作负载——如预测和描述性分析——在传统数据中心中运行得很好,没有人建议AI需要根本性的新型数据中心。

与其建设专门的AI设施,一些组织可能发现调整现有数据中心基础设施以支持不断发展的AI工作负载更有价值。

AI数据中心的关键特征

尽管如此,可以合理地得出结论:现代AI工作负载确实受益于专门设计来满足其独特需求的数据中心。数据中心实现这一目标的具体方式可能有所不同,但面向AI的数据中心的常见特征可能包括:

更大的整体容量。可以说,这是AI数据中心最重要的定义特征:它只是更大——意思是它能提供更多的总功率输入并容纳更多数量的服务器——比大多数传统数据中心都要大。

提供配备GPU或其他硬件设备的服务器,这些设备可以加速某些AI任务,如AI模型训练和推理。

优化的网络设备,如DPU,可以帮助非常快速地处理流量——这是许多AI工作负载的另一个重要要求,特别是那些需要实时处理大量数据的工作负载。

高效的数据中心冷却系统,如浸入式冷却,在某些情况下对于散发AI工作负载产生的大量热量非常重要。

可能还包括专门的电力系统,如计量后能源解决方案,可以帮助满足AI工作负载的高能耗要求。

AI数据中心与传统数据中心:模糊的界限

试图基于上述特征定义AI数据中心的棘手之处在于,这些特征都不是AI数据中心独有的。

例如,超大规模数据中心——意思是在某些情况下能够容纳超过十万台服务器的超大型设施——在现代AI出现之前就已经存在。AI使大规模数据中心变得更加重要,因为AI工作负载需要庞大的基础设施,但这并不意味着在AI兴起之前没有人建设大型数据中心。

同样,长期以来在数据中心部署配备GPU的服务器就是可能的。AI只是增加了在某些用例中访问GPU的重要性。DPU也是如此,它们已经存在多年。

同样,先进的冷却系统和数据中心电力管理的创新方法并非生成式AI时代独有。它们也早于AI数据中心出现。

AI数据中心到底是什么?

可以说,AI数据中心最终更多地由其功能(托管AI工作负载)而非实现方式(使用与任何其他类型数据中心相同类型的IT基础设施、电力和冷却系统)来定义。

因此,在纠结于AI需要投资新一代数据中心这个想法之前,也许更健康的做法是思考如何利用现有数据中心来支持AI工作负载。这种观点将帮助行业避免过度投资专门为AI设计的新数据中心的风险——作为额外好处,它可能通过允许企业重新利用现有数据中心来满足AI需求而节省资金。

Q&A

Q1:AI数据中心与传统数据中心有什么本质区别?

A:实际上AI数据中心与传统数据中心在技术特征上没有本质区别。AI数据中心主要是由其功能(托管AI工作负载)而非技术实现方式来定义的,它们使用的IT基础设施、电力和冷却系统与其他类型数据中心基本相同。

Q2:为什么AI数据中心这个概念突然变得流行?

A:AI数据中心概念的流行主要始于2022年ChatGPT推出后生成式AI进入主流。在此之前,其他AI工作负载如预测和描述性分析在传统数据中心中运行良好,没有人认为AI需要根本性的新型数据中心。

Q3:企业是否需要专门建设AI数据中心?

A:不一定需要。与其建设专门的AI设施,企业可能发现调整现有数据中心基础设施更有价值。这种方法可以避免过度投资新建数据中心的风险,同时通过重新利用现有设施来节省成本。

来源:DataCenterKnowledge

0赞

好文章,需要你的鼓励

2025

08/26

13:41

分享

点赞

邮件订阅