近期 Nvidia 的股价遭受重创,但在人工智能 (AI) 硬件市场中仍然占据主导地位。在公司最新发布的 AI 数据平台中,"主动式 AI" 和"推理"成为最新的热门词汇,各大存储供应商也纷纷追随其后。
在加利福尼亚州圣何塞举行的 GTC 2025 大会上,Nvidia 的核心发布产品是面向 AI 数据中心处理的下一代 Blackwell Ultra 图形处理器 (GPU)。该产品专为 DeepSeek R1 等推理模型设计,可提升内存和推理性能。
以 Blackwell Ultra 为核心,Nvidia 还展望了 GB/NVL 产品线中一系列机架级平台产品,以及新的 DGX 系列 SuperPod 集群、工作站、网络接口卡 (NIC)、笔记本电脑 GPU 等产品。
这些举措某种程度上是对 DeepSeek 比 ChatGPT 更高效且对 GPU 需求更低这一现象的回应。Nvidia 利用这一消息强调,我们需要更快的 AI 处理能力来充分发挥其潜力。
对大型存储供应商来说,这些输入/输出需求就像制药公司需要疾病一样重要。AI 训练和推理需要处理海量数据,这就需要大量存储设备,并且要求具备非常高的数据访问速度和容量。
因此,GTC 2025 存储领域的核心公告是 Nvidia AI 数据平台参考架构,该架构允许第三方供应商(尤其是存储厂商)按照 GPU 巨头的规格构建设备,以支持包括主动式和推理技术在内的工作负载。
与 Nvidia 合作的厂商包括 DDN、Dell、HPE、Hitachi Vantara、IBM、NetApp、Pure Storage、Vast Data 和 Weka。
这些存储厂商在 GTC 期间的具体发布内容如下:
DDN 推出了 Inferno 高速对象存储设备,将 Nvidia 的 Spectrum-X 交换机添加到 DDN Infinia 存储中。Infinia 基于键值存储,目前仅支持 S3 对象存储访问协议。
Dell 发布了一系列产品,包括面向 AI 用例的 20 petaflop 级 PC。在存储方面,重点是其 PowerScale 横向扩展文件系统现已通过 Nvidia 云合作伙伴计划企业 AI 工厂部署验证。
HPE 重点推出了新的"统一数据层",该层将覆盖企业的结构化和非结构化数据,同时宣布了一些升级,即在其 MP B10000 阵列中实现统一块存储和文件访问。
Hitachi Vantara 借此机会推出了 Hitachi iQ M 系列,该系列结合了其虚拟存储平台 One (VSP One) 存储和 Nvidia AI Enterprise 软件,并将集成 Nvidia AI 数据平台参考设计,面向主动式 AI。
IBM 宣布了与 Nvidia 的新合作,包括基于 Nvidia AI 数据平台参考设计的计划集成。IBM 计划为其混合云基础设施产品 IBM Fusion 推出内容感知存储功能,并将扩展其 Watsonx 集成。此外,还计划为 AI 客户项目提供新的 IBM 咨询能力。
NetApp 宣布获得 Nvidia SuperPOD 验证。特别是 AFF A90 产品获得了 DGX SuperPOD 验证。同时,NetApp 的 AIPod 获得了新的 Nvidia 认证存储认证,以支持 Nvidia 企业参考架构。
Pure Storage 在发布 FlashBlade//Exa 之后,趁机宣布与 Nvidia AI 数据平台的兼容性。
Vast Data 推出了企业级 AI Stack,该产品结合了 Vast 的 InsightEngine 和 Nvidia DGX 产品、BlueField-3 DPU 以及 Spectrum-X 网络。
Weka 宣布已获得 Nvidia GB200 部署的数据存储认证。WEKApod Nitro 数据平台设备已通过 Nvidia 云合作伙伴 (NCP) 部署认证,支持 HGX H200、B200 和 GB200 NVL72 产品。
好文章,需要你的鼓励
新创公司Germ为Bluesky社交网络推出端到端加密消息服务,为用户提供比现有私信更安全的聊天选项。经过两年开发,该服务本周进入测试阶段,计划逐步扩大测试用户规模。Germ采用新兴技术如消息层安全协议和AT协议,无需手机号码即可实现安全通信。用户可通过"魔法链接"快速开始聊天,利用苹果App Clips技术无需下载完整应用。
这项研究由哈佛大学团队开发的创新框架,解决了多机构数据共享的核心难题。他们巧妙结合联邦学习、局部差分隐私和公平性约束,使不同机构能在保护数据隐私的同时协作开发更准确、更公平的决策模型。实验证明,该方法在多个真实数据集上既保障了隐私,又显著提升了模型公平性,为医疗、金融和政府等领域的数据协作提供了实用解决方案。
高通公司宣布正在与领先的超大规模云服务商进行深度合作谈判,开发专用于数据中心的CPU产品。CEO阿蒙表示,公司正在开发通用CPU和推理集群产品,预计2028财年开始产生收入。同时,高通面临三星在高端智能手机市场的竞争压力,三星计划在2026年推出采用2纳米工艺的新款Exynos处理器。高通Q3财报显示营收增长10%至103.5亿美元,净利润增长25%。
Meta AI研究团队开发的ALOHA系统是一种低成本开源的双臂机器人远程操作平台,旨在使机器人学习更加民主化和普及化。该系统结合了价格亲民的硬件设计和先进的行为克隆学习算法,使机器人能够从人类示范中学习复杂技能。研究表明,ALOHA系统展示了强大的泛化能力,能够在新环境中应用所学技能,如打开不同类型的瓶子。系统的开源性质鼓励全球研究者参与并推动机器人学习领域的发展,尽管仍面临成本和精确力控制等挑战。