在AWS re:Invent大会上,NVIDIA与亚马逊云服务扩展了战略合作关系,在互连技术、云基础设施、开放模型和物理AI方面推出新的技术集成。
AWS将支持NVIDIA NVLink Fusion平台
作为合作扩展的一部分,AWS将支持NVIDIA NVLink Fusion——一个用于定制AI基础设施的平台,用于部署其定制设计的芯片,包括用于推理和智能体AI模型训练的下一代Trainium4芯片、适用于广泛工作负载的Graviton CPU以及Nitro系统虚拟化基础设施。
通过使用NVIDIA NVLink Fusion,AWS将把NVIDIA NVLink扩展互连和NVIDIA MGX机架架构与AWS定制芯片相结合,以提高性能并加快其下一代云规模AI能力的上市时间。
AWS正在设计Trainium4与NVLink和NVIDIA MGX集成,这是NVIDIA与AWS在NVLink Fusion方面多代合作的第一步。AWS已经大规模部署了配备NVIDIA GPU的MGX机架。集成NVLink Fusion将使AWS能够进一步简化其平台的部署和系统管理。
NVIDIA首席执行官黄仁勋表示:"GPU计算需求正在飞速增长——更多计算带来更智能的AI,更智能的AI推动更广泛的使用,更广泛的使用创造对更多计算的需求。AI的良性循环已经到来。"
AWS首席执行官Matt Garman表示:"AWS和NVIDIA已经并肩工作了15年多,今天标志着这一旅程的新里程碑。通过与NVIDIA的合作,我们正在推进大规模AI基础设施,为客户提供最高的性能、效率和可扩展性。"
新GPU架构支持与AI工厂服务
AWS通过NVIDIA Blackwell架构扩展了其加速计算产品组合,包括NVIDIA HGX B300和NVIDIA GB300 NVL72 GPU,为客户提供业界最先进GPU的即时访问,用于训练和推理。专为视觉应用设计的NVIDIA RTX PRO 6000 Blackwell服务器版GPU预计将在未来几周内在AWS上推出。
这些GPU构成了支持AWS AI工厂的AWS基础设施骨干。AWS AI工厂是一项新的AI云服务,将为全球客户提供在自己数据中心利用先进AI服务和能力所需的专用基础设施,由AWS运营,同时让客户保持对数据的控制并符合当地法规。
NVIDIA和AWS承诺在全球部署主权AI云,将最佳AI创新带给世界。通过推出AWS AI工厂,两家公司正在提供安全的主权AI基础设施,为全球组织提供前所未有的计算能力,同时满足日益严格的主权AI要求。
开放模型集成与向量搜索优化
在硬件之外,合作还扩展了NVIDIA软件栈与AWS AI生态系统的集成。NVIDIA Nemotron开放模型现已与Amazon Bedrock集成,使客户能够构建生产规模的生成式AI应用程序和智能体。开发者可以访问Nemotron Nano 2和Nemotron Nano 2 VL,构建处理文本、代码、图像和视频的专业智能体AI应用程序,具有高效率和准确性。
NVIDIA和AWS还在软件层面共同工程化,以加速每个企业的数据骨干。Amazon OpenSearch Service现在提供由NVIDIA cuVS支持的无服务器GPU加速向量索引构建。这一里程碑代表了使用GPU进行非结构化数据处理的根本转变,早期采用者看到向量索引速度提高了10倍,成本降低了四分之三。
物理AI与机器人技术发展
开发物理AI需要用于训练机器人模型的高质量和多样化数据集,以及在真实世界部署前在仿真中测试和验证的框架。
NVIDIA Cosmos世界基础模型现在作为NVIDIA NIM微服务在Amazon EKS上提供,支持实时机器人控制和仿真工作负载,具有无缝可靠性和云原生效率。对于批处理任务和离线工作负载,如大规模合成数据生成,Cosmos世界基础模型也可在AWS Batch上作为容器使用。
包括Agility Robotics、Agile Robots、ANYbotics、Diligent Robotics等领先机器人公司正在使用NVIDIA Isaac平台与AWS,应用场景从收集、存储和处理机器人生成的数据到训练和仿真,以扩大机器人开发规模。
NVIDIA获得了AWS全球生成式AI基础设施和数据年度合作伙伴奖,该奖项表彰具有生成式AI能力认证的顶级技术合作伙伴,支持向量嵌入、数据存储和管理或多种类型和格式的合成数据生成。
Q&A
Q1:NVIDIA NVLink Fusion是什么?它有什么作用?
A:NVIDIA NVLink Fusion是一个用于定制AI基础设施的平台。AWS将通过它部署定制设计的芯片,包括下一代Trainium4芯片、Graviton CPU和Nitro系统。它能将NVIDIA NVLink扩展互连和MGX机架架构与AWS定制芯片结合,提高性能并加快下一代云规模AI能力的上市时间。
Q2:AWS AI工厂能为企业提供什么服务?
A:AWS AI工厂是新的AI云服务,为全球客户提供在自己数据中心利用先进AI服务和能力所需的专用基础设施,由AWS运营。企业可以访问先进AI服务和能力,训练和部署大规模模型,同时保持对专有数据的绝对控制并完全符合当地监管框架。
Q3:Amazon OpenSearch Service的GPU加速有什么优势?
A:Amazon OpenSearch Service现在提供由NVIDIA cuVS支持的无服务器GPU加速向量索引构建。这代表了使用GPU进行非结构化数据处理的根本转变,早期采用者看到向量索引速度提高了10倍,成本降低了四分之三,减少搜索延迟,加速写入,并为检索增强生成等动态AI技术提供更快的生产力。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。