"AI数据中心"这个术语在现代数据中心讨论中出现频率越来越高。考虑到现代AI技术对数据中心及其内部基础设施提出了全新要求,这并不令人意外。
然而,这个术语也可能显得空洞,因为AI数据中心与其他数据中心的具体区别仍不明确。在随意使用这一术语之前——或者假设AI工作负载需要与现有数据中心根本不同的设施之前——澄清这个术语的实际含义非常重要。
什么是AI数据中心?
"AI数据中心"的简短定义是专门为托管AI工作负载而设计的设施。
然而,这个定义并不特别令人满意,因为AI工作负载的需求可能差异很大。因此,没有独特的数据中心特征能够将面向AI的设施与"常规"数据中心区分开来。
此外,直到生成式AI随着2022年ChatGPT的推出而进入主流,很少有人谈论AI数据中心。正是从那时起,媒体开始将AI数据中心作为一种独特类型的数据中心进行讨论。在此之前,其他类型的AI工作负载——如预测和描述性分析——在传统数据中心中运行得很好,没有人建议AI需要根本性的新型数据中心。
与其建设专门的AI设施,一些组织可能发现调整现有数据中心基础设施以支持不断发展的AI工作负载更有价值。
AI数据中心的关键特征
尽管如此,可以合理地得出结论:现代AI工作负载确实受益于专门设计来满足其独特需求的数据中心。数据中心实现这一目标的具体方式可能有所不同,但面向AI的数据中心的常见特征可能包括:
更大的整体容量。可以说,这是AI数据中心最重要的定义特征:它只是更大——意思是它能提供更多的总功率输入并容纳更多数量的服务器——比大多数传统数据中心都要大。
提供配备GPU或其他硬件设备的服务器,这些设备可以加速某些AI任务,如AI模型训练和推理。
优化的网络设备,如DPU,可以帮助非常快速地处理流量——这是许多AI工作负载的另一个重要要求,特别是那些需要实时处理大量数据的工作负载。
高效的数据中心冷却系统,如浸入式冷却,在某些情况下对于散发AI工作负载产生的大量热量非常重要。
可能还包括专门的电力系统,如计量后能源解决方案,可以帮助满足AI工作负载的高能耗要求。
AI数据中心与传统数据中心:模糊的界限
试图基于上述特征定义AI数据中心的棘手之处在于,这些特征都不是AI数据中心独有的。
例如,超大规模数据中心——意思是在某些情况下能够容纳超过十万台服务器的超大型设施——在现代AI出现之前就已经存在。AI使大规模数据中心变得更加重要,因为AI工作负载需要庞大的基础设施,但这并不意味着在AI兴起之前没有人建设大型数据中心。
同样,长期以来在数据中心部署配备GPU的服务器就是可能的。AI只是增加了在某些用例中访问GPU的重要性。DPU也是如此,它们已经存在多年。
同样,先进的冷却系统和数据中心电力管理的创新方法并非生成式AI时代独有。它们也早于AI数据中心出现。
AI数据中心到底是什么?
可以说,AI数据中心最终更多地由其功能(托管AI工作负载)而非实现方式(使用与任何其他类型数据中心相同类型的IT基础设施、电力和冷却系统)来定义。
因此,在纠结于AI需要投资新一代数据中心这个想法之前,也许更健康的做法是思考如何利用现有数据中心来支持AI工作负载。这种观点将帮助行业避免过度投资专门为AI设计的新数据中心的风险——作为额外好处,它可能通过允许企业重新利用现有数据中心来满足AI需求而节省资金。
Q&A
Q1:AI数据中心与传统数据中心有什么本质区别?
A:实际上AI数据中心与传统数据中心在技术特征上没有本质区别。AI数据中心主要是由其功能(托管AI工作负载)而非技术实现方式来定义的,它们使用的IT基础设施、电力和冷却系统与其他类型数据中心基本相同。
Q2:为什么AI数据中心这个概念突然变得流行?
A:AI数据中心概念的流行主要始于2022年ChatGPT推出后生成式AI进入主流。在此之前,其他AI工作负载如预测和描述性分析在传统数据中心中运行良好,没有人认为AI需要根本性的新型数据中心。
Q3:企业是否需要专门建设AI数据中心?
A:不一定需要。与其建设专门的AI设施,企业可能发现调整现有数据中心基础设施更有价值。这种方法可以避免过度投资新建数据中心的风险,同时通过重新利用现有设施来节省成本。
好文章,需要你的鼓励
施耐德电气以“新质服务+产业向‘新’行”为主题,第六次参会,展示全新升级的“新质服务体系”,围绕创新驱动、生态协同和行业赋能三大核心领域,以全新升级的“新质服务体系”,助力中国产业向高端化、智能化、绿色化迈进。
香港中文大学联合上海AI实验室推出Dispider系统,首次实现AI视频"边看边聊"能力。通过创新的三分式架构设计,将感知、决策、反应功能独立分离,让AI能像人类一样在观看视频过程中进行实时交流,在StreamingBench测试中显著超越现有系统,为教育、娱乐、医疗、安防等领域的视频AI应用开启新可能。
甲骨文正在成为大规模基础设施供应商的可靠选择。该公司通过AI技术推动应用开发,构建GenAI模型并将智能代理集成到应用套件中。CEO萨弗拉·卡茨透露,公司剩余履约义务达4553亿美元,同比增长4.6倍,并预测OCI收入将从2026财年的180亿美元增长至2030财年的1440亿美元。甲骨文正积极布局AI推理市场,凭借其作为全球最大企业私有数据托管方的优势地位,有望在云计算领域实现重大突破。
Atla公司发布Selene Mini,这是一个仅有80亿参数的AI评估模型,却在11个基准测试中全面超越GPT-4o-mini。通过精心的数据筛选和创新训练策略,该模型不仅能准确评判文本质量,还能在医疗、金融等专业领域表现出色。研究团队将模型完全开源,为AI评估技术的普及和发展做出贡献。