近期 Nvidia 的股价遭受重创,但在人工智能 (AI) 硬件市场中仍然占据主导地位。在公司最新发布的 AI 数据平台中,"主动式 AI" 和"推理"成为最新的热门词汇,各大存储供应商也纷纷追随其后。
在加利福尼亚州圣何塞举行的 GTC 2025 大会上,Nvidia 的核心发布产品是面向 AI 数据中心处理的下一代 Blackwell Ultra 图形处理器 (GPU)。该产品专为 DeepSeek R1 等推理模型设计,可提升内存和推理性能。
以 Blackwell Ultra 为核心,Nvidia 还展望了 GB/NVL 产品线中一系列机架级平台产品,以及新的 DGX 系列 SuperPod 集群、工作站、网络接口卡 (NIC)、笔记本电脑 GPU 等产品。
这些举措某种程度上是对 DeepSeek 比 ChatGPT 更高效且对 GPU 需求更低这一现象的回应。Nvidia 利用这一消息强调,我们需要更快的 AI 处理能力来充分发挥其潜力。
对大型存储供应商来说,这些输入/输出需求就像制药公司需要疾病一样重要。AI 训练和推理需要处理海量数据,这就需要大量存储设备,并且要求具备非常高的数据访问速度和容量。
因此,GTC 2025 存储领域的核心公告是 Nvidia AI 数据平台参考架构,该架构允许第三方供应商(尤其是存储厂商)按照 GPU 巨头的规格构建设备,以支持包括主动式和推理技术在内的工作负载。
与 Nvidia 合作的厂商包括 DDN、Dell、HPE、Hitachi Vantara、IBM、NetApp、Pure Storage、Vast Data 和 Weka。
这些存储厂商在 GTC 期间的具体发布内容如下:
DDN 推出了 Inferno 高速对象存储设备,将 Nvidia 的 Spectrum-X 交换机添加到 DDN Infinia 存储中。Infinia 基于键值存储,目前仅支持 S3 对象存储访问协议。
Dell 发布了一系列产品,包括面向 AI 用例的 20 petaflop 级 PC。在存储方面,重点是其 PowerScale 横向扩展文件系统现已通过 Nvidia 云合作伙伴计划企业 AI 工厂部署验证。
HPE 重点推出了新的"统一数据层",该层将覆盖企业的结构化和非结构化数据,同时宣布了一些升级,即在其 MP B10000 阵列中实现统一块存储和文件访问。
Hitachi Vantara 借此机会推出了 Hitachi iQ M 系列,该系列结合了其虚拟存储平台 One (VSP One) 存储和 Nvidia AI Enterprise 软件,并将集成 Nvidia AI 数据平台参考设计,面向主动式 AI。
IBM 宣布了与 Nvidia 的新合作,包括基于 Nvidia AI 数据平台参考设计的计划集成。IBM 计划为其混合云基础设施产品 IBM Fusion 推出内容感知存储功能,并将扩展其 Watsonx 集成。此外,还计划为 AI 客户项目提供新的 IBM 咨询能力。
NetApp 宣布获得 Nvidia SuperPOD 验证。特别是 AFF A90 产品获得了 DGX SuperPOD 验证。同时,NetApp 的 AIPod 获得了新的 Nvidia 认证存储认证,以支持 Nvidia 企业参考架构。
Pure Storage 在发布 FlashBlade//Exa 之后,趁机宣布与 Nvidia AI 数据平台的兼容性。
Vast Data 推出了企业级 AI Stack,该产品结合了 Vast 的 InsightEngine 和 Nvidia DGX 产品、BlueField-3 DPU 以及 Spectrum-X 网络。
Weka 宣布已获得 Nvidia GB200 部署的数据存储认证。WEKApod Nitro 数据平台设备已通过 Nvidia 云合作伙伴 (NCP) 部署认证,支持 HGX H200、B200 和 GB200 NVL72 产品。
好文章,需要你的鼓励
生成式AI在电商领域发展迅速,但真正的客户信任来自可靠的购物体验。数据显示近70%的在线购物者会放弃购物车,主要因为结账缓慢、隐藏费用等问题。AI基础设施工具正在解决这些信任危机,通过实时库存监控、动态结账优化和智能物流配送,帮助商家在售前、售中、售后各环节提升可靠性,最终将一次性买家转化为忠实客户。
泰国SCBX金融集团开发的DoTA-RAG系统通过动态路由和混合检索技术,成功解决了大规模知识库检索中速度与准确性难以兼得的难题。系统将1500万文档的搜索空间缩小92%,响应时间从100秒降至35秒,正确性评分提升96%,为企业级智能问答系统提供了实用的技术方案。
存储供应商Qumulo发布多租户架构Stratus,为每个租户提供独立的虚拟环境,通过加密技术和租户专用密钥管理系统实现隔离。该统一文件和对象存储软件支持本地、边缘、数据中心及AWS、Azure等云环境部署。Stratus采用加密隔离技术确保敏感数据安全,同时提供任务关键操作所需的灵活性和效率,帮助联邦和企业客户满足合规要求。
中科院和字节跳动联合开发了VGR视觉锚定推理系统,突破了传统AI只能粗略"看图"的局限。该系统能在推理过程中主动关注图片关键区域,像人类一样仔细观察细节后再得出结论。实验显示VGR在图表理解等任务上性能大幅提升,同时计算效率更高,代表了多模态AI"可视化推理"的重要进展。