亚马逊云科技与Anthropic完成超大规模AI超算集群项目

亚马逊云服务宣布Project Rainier项目完工，该项目在美国多个数据中心部署超过50万颗AWS Trainium 2芯片，支持Anthropic的Claude大语言模型训练。年底前计划将芯片数量增至100万颗。项目采用垂直供电和混合冷却技术，能耗降低46%，为企业客户提供更高效、更具成本效益的AI训练和推理服务。

亚马逊云科技（AWS）周三宣布，代号为"Project Rainier"的超大规模数据中心互联项目和史无前例的自研AI芯片部署已经完成，该项目旨在支持Anthropic的Claude大语言模型。

该项目在美国多个数据中心部署了超过50万颗AWS Trainium 2芯片，标志着大规模高效模型训练部署的重要里程碑。AWS计划在今年年底前将Trainium芯片数量增加到100万颗。位于印第安纳州的一个站点将拥有30个20万平方英尺的数据中心，内置互联的Trainium 2服务器。

除印第安纳州站点外，AWS尚未详细说明参与Project Rainier的其他美国数据中心位置。不过，该公司在美国四个地区运营着数百个数据中心，并有更多项目正在规划或建设中，仅今年就在北卡罗来纳州和宾夕法尼亚州宣布了数十亿美元的投资计划。

对于企业客户而言，AWS表示庞大的Project Rainier基础设施在成本效率、更快更大规模的AI训练和推理，以及运营韧性方面带来诸多优势。AWS已在与Anthropic的合作中投资80亿美元，Anthropic将在Project Rainier生态系统中使用Trainium 2芯片以及Graviton和Inferentia芯片。

AWS Trainium副总裁兼首席工程师Ron Diamant在接受《数据中心知识》采访时表示："当我们构建自己的设备时，我们可以优化整个技术栈，真正压缩工程时间和达到大规模的时间。这是Anthropic用于训练和推理其最先进模型的大规模集群...现在已经准备好部署并完全投入运营。"

实现超算可持续性

AWS表示其超级集群将提供更好的可持续性和能效。

Diamant说："从设计阶段开始，我们就非常关注能效。这让我们找到了几个优化点。首先是围绕历史阵列架构构建芯片，这种架构对于矩阵运算极其节能，而矩阵运算在现代机器学习工作负载中占主导地位。其次是从横向供电转向纵向供电。这将电压调节器放置在芯片下方，使我们能够以更高效率运行设备。"

AWS采用空气冷却和液体冷却相结合的方式，优先考虑效率和水资源保护。AWS表示其方法将传统冷却与针对AI硬件的闭环直接芯片液体系统相结合。这种设置使AWS能够在较冷的月份使用外部空气来减少整体水消耗。

Diamant表示："我们利用这些能效提升将成本节约回馈给客户。这也让我们能够尽快从实验室中的几台设备扩展到50万台设备的大规模运营。它实现了最大的数据中心部署灵活性。"

他补充说："Rainier的每个方面都融入了电力、冷却和材料方面的进步——从将能耗降低46%的机械组件到减少35%隐含碳的混凝土。"

企业优势与战略

Forrester首席基础设施、私有云和基础设施自动化分析师Naveen Chhabra表示，随着AI热潮推动工作负载增长，客户企业正在寻求更高效率。

他在采访中说："Project Rainier的好处是，如果你有特定的应用程序或工作负载可以在特定芯片组上得到更好的调优，你就选择那个。组织正在找出哪种芯片组能给他们带来最好的能力——不仅仅是原始性能容量，还有效率。效率变得重要，因为它可能决定你的投资回报率。"

Q&A

Q1：Project Rainier是什么项目？

A：Project Rainier是亚马逊云科技与Anthropic合作的超大规模AI超算集群项目，在美国多个数据中心部署了超过50万颗AWS Trainium 2芯片，用于支持Anthropic的Claude大语言模型训练和推理。

Q2：AWS计划部署多少Trainium芯片？

A：目前Project Rainier已部署超过50万颗AWS Trainium 2芯片，AWS计划在今年年底前将Trainium芯片数量增加到100万颗。

Q3：Project Rainier在节能方面有什么特点？

A：Project Rainier采用高能效的历史阵列架构芯片，使用纵向供电技术，结合空气和液体冷却系统，机械组件能耗降低46%，混凝土隐含碳减少35%，并在较冷月份利用外部空气减少水消耗。

来源：DataCenterKnowledge

0赞

好文章，需要你的鼓励

亚马逊云科技与Anthropic完成超大规模AI超算集群项目

来源：DataCenterKnowledge

2025

10/30

11:32

分享

点赞

稚晖君发布全球最小全身力控人形机器人，上纬启元开启个人机器人时代

2026年软件定价大洗牌：IT领导者必须知道的关键变化

Linux 在 2026 年将势不可挡，但一个开源传奇可能难以为继

CES 2026趋势展望：全球最大科技展五大热门话题预测

人工智能时代为何编程技能比以往更重要

AI颠覆云优先战略：混合计算成为唯一出路

谷歌发布JAX-Privacy 1.0：大规模差分隐私机器学习工具库

谷歌量子AI发布新型优化算法DQI：量子计算优化领域的重大突破

缓解电动汽车里程焦虑：简单AI模型如何预测充电桩可用性

Titans + MIRAS：让AI拥有长期记忆能力

Gemini为STOC 2026大会理论计算机科学家提供自动化反馈

夸克AI眼镜持续升级：首次OTA，支持89种语言翻译

TikTok将用AI技术自动将长视频转换为短视频

AI实验室如何通过Mercor获取企业不愿分享的数据

英伟达成为首家市值突破5万亿美元的公司

AWS雷尼尔人工智能超级集群正式上线运行

Fitbit应用迎来史上最大改版：AI健身教练Coach正式亮相

Zoom携手英伟达打造企业级定制AI新时代

IBM发布小型开源Granite 4模型，专为移动设备和浏览器设计

Anomalo推出智能数据分析师AIDA，为企业数据质量监控带来生成式AI功能

英伟达与思科深化合作：推动6G和电信领域AI创新

苹果明年或将推出五款全新Home产品

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: