Nvidia 公司今天宣布计划在美国大规模生产人工智能超级计算机。
公司同时透露,台湾半导体制造公司 (TSMC) 已在其位于亚利桑那州的晶圆厂园区开始生产 Blackwell 芯片。该园区目前包含一座去年启用的运营中的处理器工厂。未来几年,TSMC 计划在该地点建设另外五座晶圆厂以及两座先进封装设施。
Nvidia 同时还与其他几家供应商合作,共同推动其在美国的新制造计划。参与方包括 Amkor Technology Inc.、Wistron Corporation、SPIL Co. 以及 Foxconn。
Nvidia 的 Blackwell 芯片内置 288 千兆位的存储器,可用于存储人工智能模型的数据。该存储器与芯片中的逻辑模块(用于执行计算的组件)通过一种称为封装的互联技术集成。参与 Nvidia 新制造计划的两家合作伙伴 Amkor 以及 SPIL 均是全球领先的芯片封装供应商。
在这两家公司中,Amkor 规模较大,年收入超过 60 亿美元。目前,Amkor 正在亚利桑那州 TSMC 芯片园区附近建设一座价值 20 亿美元的封装工厂。Amkor 表示,该工厂将为包括人工智能系统在内的产品提供封装组件。
TSMC 的晶圆厂大概仅生产 Nvidia Blackwell 芯片中的逻辑模块。后者历来依赖 SK Hynix Inc. 提供与逻辑模块集成的高速存储器。今年早些时候,Samsung Electronics Co. Ltd. 也获得了为 Nvidia 处理器制造存储器的许可。
这家芯片制造商的旗舰级 Blackwell 显卡在处理以 FP4 格式存储的数据时,能够提供 20 拍浮点运算性能,而这种格式被 AI 应用广泛使用。1 拍浮点运算相当于每秒 1,000 万亿次计算。Nvidia 最近预览了改进版芯片 Blackwell Ultra,其承诺在推理工作负载上比原版提高 50% 的性能。
Nvidia 今天详细说明,尽管其 Blackwell 芯片将在亚利桑那州生产,但 AI 超级计算机将于德克萨斯州制造。该公司以 DGX 品牌销售的服务器可以互联组成超级计算机。最先进的 DGX 服务器将八颗 Blackwell 芯片与近 2TB 闪存存储以及其他辅助组件集成在一起。
根据 Nvidia 的说法,Foxconn 和 Wistron 分别将在休斯顿和达拉斯制造超级计算机。Foxconn,即富士康精密工业股份有限公司,最近透露其生产了全球大部分由 Nvidia 驱动的 AI 服务器。另一家主要的电子制造商 Wistron 也据称正在美国投资 5000 万美元建设一座 AI 服务器工厂。
Nvidia 表示,参与该计划的供应商将共同投入超过 100 万平方英尺的制造空间用于生产其产品。根据该芯片制造商的说法,Foxconn 和 Wistron 的设施将在未来 12 至 18 个月内扩展生产规模。
Nvidia 将协助设计和运营这些新工厂。该公司计划利用其 Omniverse 和 Isaac GR00T 产品套件完成这一工作。
Omniverse 是一组可以用于创建数字孪生(物理系统的虚拟复制品)的软件工具。制造商利用数字孪生来模拟生产线,并找出改进之处。Nvidia 计划在该项目中使用的另一款产品套件 Isaac GR00T 则简化了为工厂机器人开发 AI 模型的过程。
Nvidia 首席执行官 Jensen Huang 表示:“全球 AI 基础设施的引擎首次在美国建设。增加美国本土制造有助于我们更好地满足对 AI 芯片和超级计算机日益增长的需求,增强我们的供应链并提升我们的韧性。”
好文章,需要你的鼓励
生成式AI在电商领域发展迅速,但真正的客户信任来自可靠的购物体验。数据显示近70%的在线购物者会放弃购物车,主要因为结账缓慢、隐藏费用等问题。AI基础设施工具正在解决这些信任危机,通过实时库存监控、动态结账优化和智能物流配送,帮助商家在售前、售中、售后各环节提升可靠性,最终将一次性买家转化为忠实客户。
泰国SCBX金融集团开发的DoTA-RAG系统通过动态路由和混合检索技术,成功解决了大规模知识库检索中速度与准确性难以兼得的难题。系统将1500万文档的搜索空间缩小92%,响应时间从100秒降至35秒,正确性评分提升96%,为企业级智能问答系统提供了实用的技术方案。
存储供应商Qumulo发布多租户架构Stratus,为每个租户提供独立的虚拟环境,通过加密技术和租户专用密钥管理系统实现隔离。该统一文件和对象存储软件支持本地、边缘、数据中心及AWS、Azure等云环境部署。Stratus采用加密隔离技术确保敏感数据安全,同时提供任务关键操作所需的灵活性和效率,帮助联邦和企业客户满足合规要求。
中科院和字节跳动联合开发了VGR视觉锚定推理系统,突破了传统AI只能粗略"看图"的局限。该系统能在推理过程中主动关注图片关键区域,像人类一样仔细观察细节后再得出结论。实验显示VGR在图表理解等任务上性能大幅提升,同时计算效率更高,代表了多模态AI"可视化推理"的重要进展。