AWS推出主权AI本地部署方案及新一代AI加速器

亚马逊云服务发布AI工厂解决方案，支持政府和监管行业在本地数据中心部署完整AWS AI基础设施。同时推出搭载三纳米Trainium3芯片的EC2 Trn3超级服务器，性能较前代提升4.4倍，能效提升4倍。此外还引入配备英伟达GB300 NVL72平台的P6e-GB300超级服务器，为万亿参数AI推理提供最高GPU密度支持。

亚马逊云科技今日发布了一系列人工智能基础设施产品，涵盖主权本地部署、下一代定制AI加速器以及AWS上最先进的英伟达GPU实例，旨在主导云端和私有大规模AI市场。

此次发布包括AWS AI工厂的推出、搭载全新Trainium3芯片的Amazon EC2 Trn3 UltraServers正式上线，以及配备英伟达最新基于Blackwell架构GB300 NVL72平台的P6e-GB300 UltraServers。

AWS AI工厂

AWS AI工厂是此次发布的重点产品，这一全新服务将专用的全栈AWS AI基础设施直接部署到客户现有的数据中心内。

该平台整合了英伟达加速计算、AWS Trainium芯片、高速低延迟网络、节能基础设施以及核心AWS AI服务，包括Amazon Bedrock和Amazon SageMaker。

AWS AI工厂主要面向政府和受监管行业构建，运行方式类似私有AWS区域，在确保严格数据主权和监管合规的同时，提供安全、低延迟的计算、存储和AI服务访问。通过这一产品，客户可以利用自己的设施、电力和网络连接，而AWS负责部署、运营和生命周期管理。AWS表示，这一方案将原本需要数年的部署时间大幅缩短。

作为AI工厂发布的一部分，AWS还强调了与英伟达在该平台上的深度合作，包括对Grace Blackwell和未来Vera Rubin GPU架构的支持，以及Trainium4对英伟达NVLink Fusion互连的未来支持。

英伟达超大规模和高性能计算副总裁兼总经理Ian Buck表示："大规模AI需要全栈方法——从先进GPU和网络到优化数据中心每一层的软件和服务。我们与AWS合作，将所有这些直接交付到客户环境中。"

Trainium3 UltraServers

AWS还宣布搭载全新三纳米Trainium3 AI芯片的Amazon EC2 Trn3 UltraServers正式上线。

Trn3系统可在单个UltraServer中扩展至144个Trainium3芯片，相比Trainium2提供高达4.4倍的计算性能、4倍的能效以及近4倍的内存带宽。

这些UltraServers专为下一代工作负载设计，如智能体AI、专家混合模型和大规模强化学习，配备AWS工程化网络，实现低于10微秒的芯片间延迟。

在使用OpenAI开源权重模型GPT-OSS的测试中，AWS客户相比上一代产品实现了每芯片3倍的吞吐量提升和4倍的推理响应速度。包括Anthropic、Karakuri、Metagenomi、Neto.ai、理光和Splash Music在内的客户已报告训练和推理成本降低高达50%。

AWS还预览了Trainium4，预计将在FP4和FP8性能以及内存带宽方面实现重大提升。

英伟达GB300

在AI基础设施发布中，AWS推出了全新的P6e-GB300 UltraServers，配备英伟达GB300 NVL72平台，成为Amazon EC2上最先进的英伟达GPU架构。

这些实例在AWS上提供最高的GPU内存和计算密度，面向万亿参数AI推理和生产环境中的高级推理模型。

P6e-GB300系统运行在AWS Nitro系统上，与Amazon Elastic Kubernetes Service等服务紧密集成，使客户能够安全高效地部署大规模推理工作负载。

Q&A

Q1：AWS AI工厂是什么？主要面向哪些客户？

A：AWS AI工厂是亚马逊云科技推出的全新服务，将专用的全栈AWS AI基础设施直接部署到客户现有数据中心内。主要面向政府和受监管行业，运行方式类似私有AWS区域，在确保数据主权和监管合规的同时提供AI服务。

Q2：Trainium3相比上一代有什么提升？

A：Trainium3采用三纳米工艺，相比Trainium2提供高达4.4倍的计算性能、4倍的能效以及近4倍的内存带宽。在测试中，客户实现了每芯片3倍的吞吐量提升和4倍的推理响应速度，训练和推理成本降低高达50%。

Q3：P6e-GB300 UltraServers有什么特点？

A：P6e-GB300 UltraServers配备英伟达最新的GB300 NVL72平台，是Amazon EC2上最先进的英伟达GPU架构。提供AWS上最高的GPU内存和计算密度，专门面向万亿参数AI推理和生产环境中的高级推理模型。

来源：SiliconANGLE

0赞

好文章，需要你的鼓励

AWS推出主权AI本地部署方案及新一代AI加速器

来源：SiliconANGLE

2025

12/03

08:01

分享

点赞

AWS推出主权AI本地部署方案及新一代AI加速器

HPE 2025年存储业务：Alletra产品线全面崛起

AWS与谷歌云合作推出多云快速连接服务

AV Linux 25和MX Moksha 25发布：两款音频制作专用Linux发行版

Windows智能体操作系统引争议：AI不应深入OS核心

Gartner发布2026-2029年企业存储战略路线图

MongoDB强调AI优势并质疑PostgreSQL扩展性

Mistral发布新一代开放权重模型挑战科技巨头

DeepSeek回应消失传闻，发布DeepSeek V3.2模型

NVIDIA 与新思科技宣布建立战略合作伙伴关系，携手重塑工程与设计未来

对话高途创始人陈向东：AI浪潮里，如何重写“教”和“育”？

Z世代与AI重塑商业世界：数字原住民如何驾驭人工智能浪潮

HPE 2025年存储业务：Alletra产品线全面崛起

AV Linux 25和MX Moksha 25发布：两款音频制作专用Linux发行版

Windows智能体操作系统引争议：AI不应深入OS核心

MongoDB强调AI优势并质疑PostgreSQL扩展性

Mistral发布新一代开放权重模型挑战科技巨头

Z世代与AI重塑商业世界：数字原住民如何驾驭人工智能浪潮

谷歌AI最大优势：对你的深度了解

Runway与DeepSeek发布新一代基础模型，性能超越行业巨头算法

英伟达发布自动驾驶研究新开源AI模型与工具

波兰小创企如何成为数十亿美元AI语音巨头

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: