亚马逊云科技今日发布了一系列人工智能基础设施产品,涵盖主权本地部署、下一代定制AI加速器以及AWS上最先进的英伟达GPU实例,旨在主导云端和私有大规模AI市场。
此次发布包括AWS AI工厂的推出、搭载全新Trainium3芯片的Amazon EC2 Trn3 UltraServers正式上线,以及配备英伟达最新基于Blackwell架构GB300 NVL72平台的P6e-GB300 UltraServers。
AWS AI工厂
AWS AI工厂是此次发布的重点产品,这一全新服务将专用的全栈AWS AI基础设施直接部署到客户现有的数据中心内。
该平台整合了英伟达加速计算、AWS Trainium芯片、高速低延迟网络、节能基础设施以及核心AWS AI服务,包括Amazon Bedrock和Amazon SageMaker。
AWS AI工厂主要面向政府和受监管行业构建,运行方式类似私有AWS区域,在确保严格数据主权和监管合规的同时,提供安全、低延迟的计算、存储和AI服务访问。通过这一产品,客户可以利用自己的设施、电力和网络连接,而AWS负责部署、运营和生命周期管理。AWS表示,这一方案将原本需要数年的部署时间大幅缩短。
作为AI工厂发布的一部分,AWS还强调了与英伟达在该平台上的深度合作,包括对Grace Blackwell和未来Vera Rubin GPU架构的支持,以及Trainium4对英伟达NVLink Fusion互连的未来支持。
英伟达超大规模和高性能计算副总裁兼总经理Ian Buck表示:"大规模AI需要全栈方法——从先进GPU和网络到优化数据中心每一层的软件和服务。我们与AWS合作,将所有这些直接交付到客户环境中。"
Trainium3 UltraServers
AWS还宣布搭载全新三纳米Trainium3 AI芯片的Amazon EC2 Trn3 UltraServers正式上线。
Trn3系统可在单个UltraServer中扩展至144个Trainium3芯片,相比Trainium2提供高达4.4倍的计算性能、4倍的能效以及近4倍的内存带宽。
这些UltraServers专为下一代工作负载设计,如智能体AI、专家混合模型和大规模强化学习,配备AWS工程化网络,实现低于10微秒的芯片间延迟。
在使用OpenAI开源权重模型GPT-OSS的测试中,AWS客户相比上一代产品实现了每芯片3倍的吞吐量提升和4倍的推理响应速度。包括Anthropic、Karakuri、Metagenomi、Neto.ai、理光和Splash Music在内的客户已报告训练和推理成本降低高达50%。
AWS还预览了Trainium4,预计将在FP4和FP8性能以及内存带宽方面实现重大提升。
英伟达GB300
在AI基础设施发布中,AWS推出了全新的P6e-GB300 UltraServers,配备英伟达GB300 NVL72平台,成为Amazon EC2上最先进的英伟达GPU架构。
这些实例在AWS上提供最高的GPU内存和计算密度,面向万亿参数AI推理和生产环境中的高级推理模型。
P6e-GB300系统运行在AWS Nitro系统上,与Amazon Elastic Kubernetes Service等服务紧密集成,使客户能够安全高效地部署大规模推理工作负载。
Q&A
Q1:AWS AI工厂是什么?主要面向哪些客户?
A:AWS AI工厂是亚马逊云科技推出的全新服务,将专用的全栈AWS AI基础设施直接部署到客户现有数据中心内。主要面向政府和受监管行业,运行方式类似私有AWS区域,在确保数据主权和监管合规的同时提供AI服务。
Q2:Trainium3相比上一代有什么提升?
A:Trainium3采用三纳米工艺,相比Trainium2提供高达4.4倍的计算性能、4倍的能效以及近4倍的内存带宽。在测试中,客户实现了每芯片3倍的吞吐量提升和4倍的推理响应速度,训练和推理成本降低高达50%。
Q3:P6e-GB300 UltraServers有什么特点?
A:P6e-GB300 UltraServers配备英伟达最新的GB300 NVL72平台,是Amazon EC2上最先进的英伟达GPU架构。提供AWS上最高的GPU内存和计算密度,专门面向万亿参数AI推理和生产环境中的高级推理模型。
好文章,需要你的鼓励
微软于12月1日正式关闭混合现实协作平台Mesh,将用户引导至Teams的沉浸式活动功能。Mesh作为独立服务在2024年正式发布,提供3D虚拟会议环境,但与Teams功能重叠明显。微软已将相关功能直接整合到Teams中,需要商业Teams许可证和Premium许可证才能主持沉浸式活动。这标志着微软元宇宙雄心的终结,公司已放弃HoloLens项目和美军合同,转向AI发展战略。
这项研究开发了CaptionQA系统,通过测试AI生成的图片描述能否支持实际任务来评估其真正价值。研究发现即使最先进的AI模型在图片描述实用性方面也存在显著不足,描述质量比直接看图时下降9%-40%。研究涵盖自然、文档、电商、机器人四个领域,为AI技术的实用性评估提供了新标准。
亚马逊云服务发布AI工厂解决方案,支持政府和监管行业在本地数据中心部署完整AWS AI基础设施。同时推出搭载三纳米Trainium3芯片的EC2 Trn3超级服务器,性能较前代提升4.4倍,能效提升4倍。此外还引入配备英伟达GB300 NVL72平台的P6e-GB300超级服务器,为万亿参数AI推理提供最高GPU密度支持。
以色列理工学院研究团队提出了一种将专家混合模型融入YOLOv9目标检测的创新方法。该方法让多个专门化的YOLOv9-T专家分工协作,通过智能路由器动态选择最适合的专家处理不同类型图像。实验显示,在COCO数据集上平均精度提升超过10%,在VisDrone数据集上提升近30%,证明了"分工合作"比单一模型更有效,为AI视觉系统提供了新思路。