Nvidia 公司今天宣布计划在美国大规模生产人工智能超级计算机。
公司同时透露,台湾半导体制造公司 (TSMC) 已在其位于亚利桑那州的晶圆厂园区开始生产 Blackwell 芯片。该园区目前包含一座去年启用的运营中的处理器工厂。未来几年,TSMC 计划在该地点建设另外五座晶圆厂以及两座先进封装设施。
Nvidia 同时还与其他几家供应商合作,共同推动其在美国的新制造计划。参与方包括 Amkor Technology Inc.、Wistron Corporation、SPIL Co. 以及 Foxconn。
Nvidia 的 Blackwell 芯片内置 288 千兆位的存储器,可用于存储人工智能模型的数据。该存储器与芯片中的逻辑模块(用于执行计算的组件)通过一种称为封装的互联技术集成。参与 Nvidia 新制造计划的两家合作伙伴 Amkor 以及 SPIL 均是全球领先的芯片封装供应商。
在这两家公司中,Amkor 规模较大,年收入超过 60 亿美元。目前,Amkor 正在亚利桑那州 TSMC 芯片园区附近建设一座价值 20 亿美元的封装工厂。Amkor 表示,该工厂将为包括人工智能系统在内的产品提供封装组件。
TSMC 的晶圆厂大概仅生产 Nvidia Blackwell 芯片中的逻辑模块。后者历来依赖 SK Hynix Inc. 提供与逻辑模块集成的高速存储器。今年早些时候,Samsung Electronics Co. Ltd. 也获得了为 Nvidia 处理器制造存储器的许可。
这家芯片制造商的旗舰级 Blackwell 显卡在处理以 FP4 格式存储的数据时,能够提供 20 拍浮点运算性能,而这种格式被 AI 应用广泛使用。1 拍浮点运算相当于每秒 1,000 万亿次计算。Nvidia 最近预览了改进版芯片 Blackwell Ultra,其承诺在推理工作负载上比原版提高 50% 的性能。
Nvidia 今天详细说明,尽管其 Blackwell 芯片将在亚利桑那州生产,但 AI 超级计算机将于德克萨斯州制造。该公司以 DGX 品牌销售的服务器可以互联组成超级计算机。最先进的 DGX 服务器将八颗 Blackwell 芯片与近 2TB 闪存存储以及其他辅助组件集成在一起。
根据 Nvidia 的说法,Foxconn 和 Wistron 分别将在休斯顿和达拉斯制造超级计算机。Foxconn,即富士康精密工业股份有限公司,最近透露其生产了全球大部分由 Nvidia 驱动的 AI 服务器。另一家主要的电子制造商 Wistron 也据称正在美国投资 5000 万美元建设一座 AI 服务器工厂。
Nvidia 表示,参与该计划的供应商将共同投入超过 100 万平方英尺的制造空间用于生产其产品。根据该芯片制造商的说法,Foxconn 和 Wistron 的设施将在未来 12 至 18 个月内扩展生产规模。
Nvidia 将协助设计和运营这些新工厂。该公司计划利用其 Omniverse 和 Isaac GR00T 产品套件完成这一工作。
Omniverse 是一组可以用于创建数字孪生(物理系统的虚拟复制品)的软件工具。制造商利用数字孪生来模拟生产线,并找出改进之处。Nvidia 计划在该项目中使用的另一款产品套件 Isaac GR00T 则简化了为工厂机器人开发 AI 模型的过程。
Nvidia 首席执行官 Jensen Huang 表示:“全球 AI 基础设施的引擎首次在美国建设。增加美国本土制造有助于我们更好地满足对 AI 芯片和超级计算机日益增长的需求,增强我们的供应链并提升我们的韧性。”
好文章,需要你的鼓励
这项研究提出了R1-Searcher++框架,通过两阶段训练策略使大语言模型能像人类一样灵活利用内部知识和外部信息。该方法创新性地采用强化学习激励模型优先使用内部知识,并引入记忆机制将检索到的信息转化为内部知识,实现动态知识获取。实验表明,R1-Searcher++不仅在多步问答任务上表现优异,还大幅减少了检索次数,显著提高了推理效率。
这项研究提出了AutoRefine,一种革新性的强化学习框架,为大语言模型引入了"边思考边搜索和完善"的全新范式。与传统方法不同,AutoRefine在连续搜索调用之间添加知识完善步骤,让模型能够有效过滤和组织信息。通过结合答案正确性和检索质量双重奖励,该方法在七项问答基准测试中平均提升6.9%的准确率,特别在复杂多跳推理场景中表现突出,解决了现有检索增强推理的核心局限性。
这项研究揭示了一种新型网络安全威胁:利用普通网络广告攻击AI网页代理。中科院研究团队开发的AdInject攻击无需特殊权限,仅通过精心设计的广告内容就能误导AI代理点击恶意链接,成功率高达90%以上。研究使用严格的黑盒模型,更符合现实场景,暴露了当前AI代理面临的实际安全漏洞。实验还表明,即使添加专门的防御提示,这类攻击仍能成功率超过50%,凸显了设计更强大防御机制的紧迫性。
东北大学与快手科技联合研发的UNITE系统为多模态信息检索带来突破性进展。这项发表于2025年5月的研究首次系统分析了模态特定数据如何影响检索性能,并提出创新的模态感知掩码对比学习技术,有效解决不同模态间的竞争关系。UNITE能同时处理文本、图像、视频及其组合,在40多项测试中超越现有方法,即使与参数规模更大的模型相比也表现出色。研究发现视频-文本对在通用检索中表现优异,而文本-文本和文本-图像对对指令遵循任务至关重要,为未来多模态系统研究提供了宝贵指南。