Nvidia 公司今天宣布计划在美国大规模生产人工智能超级计算机。
公司同时透露,台湾半导体制造公司 (TSMC) 已在其位于亚利桑那州的晶圆厂园区开始生产 Blackwell 芯片。该园区目前包含一座去年启用的运营中的处理器工厂。未来几年,TSMC 计划在该地点建设另外五座晶圆厂以及两座先进封装设施。
Nvidia 同时还与其他几家供应商合作,共同推动其在美国的新制造计划。参与方包括 Amkor Technology Inc.、Wistron Corporation、SPIL Co. 以及 Foxconn。
Nvidia 的 Blackwell 芯片内置 288 千兆位的存储器,可用于存储人工智能模型的数据。该存储器与芯片中的逻辑模块(用于执行计算的组件)通过一种称为封装的互联技术集成。参与 Nvidia 新制造计划的两家合作伙伴 Amkor 以及 SPIL 均是全球领先的芯片封装供应商。
在这两家公司中,Amkor 规模较大,年收入超过 60 亿美元。目前,Amkor 正在亚利桑那州 TSMC 芯片园区附近建设一座价值 20 亿美元的封装工厂。Amkor 表示,该工厂将为包括人工智能系统在内的产品提供封装组件。
TSMC 的晶圆厂大概仅生产 Nvidia Blackwell 芯片中的逻辑模块。后者历来依赖 SK Hynix Inc. 提供与逻辑模块集成的高速存储器。今年早些时候,Samsung Electronics Co. Ltd. 也获得了为 Nvidia 处理器制造存储器的许可。
这家芯片制造商的旗舰级 Blackwell 显卡在处理以 FP4 格式存储的数据时,能够提供 20 拍浮点运算性能,而这种格式被 AI 应用广泛使用。1 拍浮点运算相当于每秒 1,000 万亿次计算。Nvidia 最近预览了改进版芯片 Blackwell Ultra,其承诺在推理工作负载上比原版提高 50% 的性能。
Nvidia 今天详细说明,尽管其 Blackwell 芯片将在亚利桑那州生产,但 AI 超级计算机将于德克萨斯州制造。该公司以 DGX 品牌销售的服务器可以互联组成超级计算机。最先进的 DGX 服务器将八颗 Blackwell 芯片与近 2TB 闪存存储以及其他辅助组件集成在一起。
根据 Nvidia 的说法,Foxconn 和 Wistron 分别将在休斯顿和达拉斯制造超级计算机。Foxconn,即富士康精密工业股份有限公司,最近透露其生产了全球大部分由 Nvidia 驱动的 AI 服务器。另一家主要的电子制造商 Wistron 也据称正在美国投资 5000 万美元建设一座 AI 服务器工厂。
Nvidia 表示,参与该计划的供应商将共同投入超过 100 万平方英尺的制造空间用于生产其产品。根据该芯片制造商的说法,Foxconn 和 Wistron 的设施将在未来 12 至 18 个月内扩展生产规模。
Nvidia 将协助设计和运营这些新工厂。该公司计划利用其 Omniverse 和 Isaac GR00T 产品套件完成这一工作。
Omniverse 是一组可以用于创建数字孪生(物理系统的虚拟复制品)的软件工具。制造商利用数字孪生来模拟生产线,并找出改进之处。Nvidia 计划在该项目中使用的另一款产品套件 Isaac GR00T 则简化了为工厂机器人开发 AI 模型的过程。
Nvidia 首席执行官 Jensen Huang 表示:“全球 AI 基础设施的引擎首次在美国建设。增加美国本土制造有助于我们更好地满足对 AI 芯片和超级计算机日益增长的需求,增强我们的供应链并提升我们的韧性。”
好文章,需要你的鼓励
Turner & Townsend发布的2025年数据中心建设成本指数报告显示,AI工作负载激增正推动高密度液冷数据中心需求。四分之三的受访者已在从事AI数据中心项目,47%预计AI数据中心将在两年内占据一半以上工作负载。预计到2027年,AI优化设施可能占全球数据中心市场28%。53%受访者认为液冷技术将主导未来高密度项目。电力可用性成为开发商面临的首要约束,48%的受访者认为电网连接延迟是主要障碍。
MiroMind AI等机构联合研究团队提出了UniME-V2多模态嵌入学习新方法,通过让大型多模态语言模型充当"智能法官"来评估训练样本质量,解决了传统方法在负样本多样性和语义理解精度方面的问题。该方法引入软标签训练框架和困难负样本挖掘技术,在MMEB基准测试中取得显著性能提升,特别在组合式检索任务上表现出色,为多模态AI应用的准确性和用户体验改进提供了重要技术支撑。
亚马逊云服务宣布投资500亿美元,专门为美国政府构建AI高性能计算基础设施。该项目将新增1.3千兆瓦算力,扩大政府机构对AWS AI服务的访问,包括Amazon SageMaker、Amazon Bedrock和Claude聊天机器人等。预计2026年开工建设。AWS CEO表示此举将彻底改变联邦机构利用超级计算的方式,消除技术障碍,助力美国在AI时代保持领先地位。
南洋理工大学团队开发了Uni-MMMU基准测试,专门评估AI模型的理解与生成协同能力。该基准包含八个精心设计的任务,要求AI像人类一样"边看边想边画"来解决复杂问题。研究发现当前AI模型在这种协同任务上表现不平衡,生成能力是主要瓶颈,但协同工作确实能提升问题解决效果,为开发更智能的AI助手指明了方向。