亚马逊云科技今日发布了一系列人工智能基础设施产品,涵盖主权本地部署、下一代定制AI加速器以及AWS上最先进的英伟达GPU实例,旨在主导云端和私有大规模AI市场。
此次发布包括AWS AI工厂的推出、搭载全新Trainium3芯片的Amazon EC2 Trn3 UltraServers正式上线,以及配备英伟达最新基于Blackwell架构GB300 NVL72平台的P6e-GB300 UltraServers。
AWS AI工厂
AWS AI工厂是此次发布的重点产品,这一全新服务将专用的全栈AWS AI基础设施直接部署到客户现有的数据中心内。
该平台整合了英伟达加速计算、AWS Trainium芯片、高速低延迟网络、节能基础设施以及核心AWS AI服务,包括Amazon Bedrock和Amazon SageMaker。
AWS AI工厂主要面向政府和受监管行业构建,运行方式类似私有AWS区域,在确保严格数据主权和监管合规的同时,提供安全、低延迟的计算、存储和AI服务访问。通过这一产品,客户可以利用自己的设施、电力和网络连接,而AWS负责部署、运营和生命周期管理。AWS表示,这一方案将原本需要数年的部署时间大幅缩短。
作为AI工厂发布的一部分,AWS还强调了与英伟达在该平台上的深度合作,包括对Grace Blackwell和未来Vera Rubin GPU架构的支持,以及Trainium4对英伟达NVLink Fusion互连的未来支持。
英伟达超大规模和高性能计算副总裁兼总经理Ian Buck表示:"大规模AI需要全栈方法——从先进GPU和网络到优化数据中心每一层的软件和服务。我们与AWS合作,将所有这些直接交付到客户环境中。"
Trainium3 UltraServers
AWS还宣布搭载全新三纳米Trainium3 AI芯片的Amazon EC2 Trn3 UltraServers正式上线。
Trn3系统可在单个UltraServer中扩展至144个Trainium3芯片,相比Trainium2提供高达4.4倍的计算性能、4倍的能效以及近4倍的内存带宽。
这些UltraServers专为下一代工作负载设计,如智能体AI、专家混合模型和大规模强化学习,配备AWS工程化网络,实现低于10微秒的芯片间延迟。
在使用OpenAI开源权重模型GPT-OSS的测试中,AWS客户相比上一代产品实现了每芯片3倍的吞吐量提升和4倍的推理响应速度。包括Anthropic、Karakuri、Metagenomi、Neto.ai、理光和Splash Music在内的客户已报告训练和推理成本降低高达50%。
AWS还预览了Trainium4,预计将在FP4和FP8性能以及内存带宽方面实现重大提升。
英伟达GB300
在AI基础设施发布中,AWS推出了全新的P6e-GB300 UltraServers,配备英伟达GB300 NVL72平台,成为Amazon EC2上最先进的英伟达GPU架构。
这些实例在AWS上提供最高的GPU内存和计算密度,面向万亿参数AI推理和生产环境中的高级推理模型。
P6e-GB300系统运行在AWS Nitro系统上,与Amazon Elastic Kubernetes Service等服务紧密集成,使客户能够安全高效地部署大规模推理工作负载。
Q&A
Q1:AWS AI工厂是什么?主要面向哪些客户?
A:AWS AI工厂是亚马逊云科技推出的全新服务,将专用的全栈AWS AI基础设施直接部署到客户现有数据中心内。主要面向政府和受监管行业,运行方式类似私有AWS区域,在确保数据主权和监管合规的同时提供AI服务。
Q2:Trainium3相比上一代有什么提升?
A:Trainium3采用三纳米工艺,相比Trainium2提供高达4.4倍的计算性能、4倍的能效以及近4倍的内存带宽。在测试中,客户实现了每芯片3倍的吞吐量提升和4倍的推理响应速度,训练和推理成本降低高达50%。
Q3:P6e-GB300 UltraServers有什么特点?
A:P6e-GB300 UltraServers配备英伟达最新的GB300 NVL72平台,是Amazon EC2上最先进的英伟达GPU架构。提供AWS上最高的GPU内存和计算密度,专门面向万亿参数AI推理和生产环境中的高级推理模型。
好文章,需要你的鼓励
Instagram负责人莫塞里在接受采访时透露,平台正考虑引入长视频内容功能,尽管此前一直专注于短视频。他承认为了吸引优质内容,Instagram可能需要支持长视频格式。此外,Meta最近推出了"您的算法"功能,旨在让用户更好地控制信息流内容。莫塞里承诺未来将提供更多工具,让用户主动塑造个性化内容,但完整实现可能需要2-4年时间。
香港大学联合Adobe研究院提出PS-VAE技术,成功解决了AI无法同时具备图像理解和生成能力的难题。通过创新的两阶段训练策略,让AI既能准确理解图片语义,又能生成高质量图像,在图像编辑任务上性能提升近4倍,为统一视觉AI系统开辟新路径,在数字创作、教育、电商等领域具有广阔应用前景。
在信息爆炸的时代,AI实验室的研究员们常常需要面对海量的论文、专利文件、论坛发言等各种渠道的信息。传统的查找方式不仅费时费力,还容易遗漏关键内容。那么,有没有一种方式能让AI真正代替人工,完成从找资料到写出稿的全流程工作?
华中科技大学与马里兰大学研究团队开发出Sage评估框架,首次无需人工标注即可评估AI评判员可靠性。研究发现即使最先进的AI模型在评判任务中也存在严重不一致问题,近四分之一困难情况下无法保持稳定偏好。团队提出明确评判标准和专门微调等改进方法,为构建更可靠AI评估体系提供重要工具。