近期 Nvidia 的股价遭受重创,但在人工智能 (AI) 硬件市场中仍然占据主导地位。在公司最新发布的 AI 数据平台中,"主动式 AI" 和"推理"成为最新的热门词汇,各大存储供应商也纷纷追随其后。
在加利福尼亚州圣何塞举行的 GTC 2025 大会上,Nvidia 的核心发布产品是面向 AI 数据中心处理的下一代 Blackwell Ultra 图形处理器 (GPU)。该产品专为 DeepSeek R1 等推理模型设计,可提升内存和推理性能。
以 Blackwell Ultra 为核心,Nvidia 还展望了 GB/NVL 产品线中一系列机架级平台产品,以及新的 DGX 系列 SuperPod 集群、工作站、网络接口卡 (NIC)、笔记本电脑 GPU 等产品。
这些举措某种程度上是对 DeepSeek 比 ChatGPT 更高效且对 GPU 需求更低这一现象的回应。Nvidia 利用这一消息强调,我们需要更快的 AI 处理能力来充分发挥其潜力。
对大型存储供应商来说,这些输入/输出需求就像制药公司需要疾病一样重要。AI 训练和推理需要处理海量数据,这就需要大量存储设备,并且要求具备非常高的数据访问速度和容量。
因此,GTC 2025 存储领域的核心公告是 Nvidia AI 数据平台参考架构,该架构允许第三方供应商(尤其是存储厂商)按照 GPU 巨头的规格构建设备,以支持包括主动式和推理技术在内的工作负载。
与 Nvidia 合作的厂商包括 DDN、Dell、HPE、Hitachi Vantara、IBM、NetApp、Pure Storage、Vast Data 和 Weka。
这些存储厂商在 GTC 期间的具体发布内容如下:
DDN 推出了 Inferno 高速对象存储设备,将 Nvidia 的 Spectrum-X 交换机添加到 DDN Infinia 存储中。Infinia 基于键值存储,目前仅支持 S3 对象存储访问协议。
Dell 发布了一系列产品,包括面向 AI 用例的 20 petaflop 级 PC。在存储方面,重点是其 PowerScale 横向扩展文件系统现已通过 Nvidia 云合作伙伴计划企业 AI 工厂部署验证。
HPE 重点推出了新的"统一数据层",该层将覆盖企业的结构化和非结构化数据,同时宣布了一些升级,即在其 MP B10000 阵列中实现统一块存储和文件访问。
Hitachi Vantara 借此机会推出了 Hitachi iQ M 系列,该系列结合了其虚拟存储平台 One (VSP One) 存储和 Nvidia AI Enterprise 软件,并将集成 Nvidia AI 数据平台参考设计,面向主动式 AI。
IBM 宣布了与 Nvidia 的新合作,包括基于 Nvidia AI 数据平台参考设计的计划集成。IBM 计划为其混合云基础设施产品 IBM Fusion 推出内容感知存储功能,并将扩展其 Watsonx 集成。此外,还计划为 AI 客户项目提供新的 IBM 咨询能力。
NetApp 宣布获得 Nvidia SuperPOD 验证。特别是 AFF A90 产品获得了 DGX SuperPOD 验证。同时,NetApp 的 AIPod 获得了新的 Nvidia 认证存储认证,以支持 Nvidia 企业参考架构。
Pure Storage 在发布 FlashBlade//Exa 之后,趁机宣布与 Nvidia AI 数据平台的兼容性。
Vast Data 推出了企业级 AI Stack,该产品结合了 Vast 的 InsightEngine 和 Nvidia DGX 产品、BlueField-3 DPU 以及 Spectrum-X 网络。
Weka 宣布已获得 Nvidia GB200 部署的数据存储认证。WEKApod Nitro 数据平台设备已通过 Nvidia 云合作伙伴 (NCP) 部署认证,支持 HGX H200、B200 和 GB200 NVL72 产品。
好文章,需要你的鼓励
IBM Spyre加速器将于本月晚些时候正式推出,为z17大型机、LinuxONE 5和Power11系统等企业级硬件的AI能力提供显著提升。该加速器基于定制芯片的PCIe卡,配备32个独立加速器核心,专为处理AI工作负载需求而设计。系统最多可配置48张Spyre卡,支持多模型AI处理,包括生成式AI和大语言模型,主要应用于金融交易欺诈检测等关键业务场景。
加拿大女王大学研究团队首次对开源AI生态系统进行端到端许可证合规审计,发现35.5%的AI模型在集成到应用时存在许可证违规。他们开发的LicenseRec系统能自动检测冲突并修复86.4%的违规问题,揭示了AI供应链中系统性的"许可证漂移"现象及其法律风险。
意大利初创公司Ganiga开发了AI驱动的智能垃圾分拣机器人Hoooly,能自动识别并分类垃圾和可回收物。该公司产品包括机器人垃圾桶、智能盖子和废物追踪软件,旨在解决全球塑料回收率不足10%的问题。2024年公司收入50万美元,已向谷歌和多个机场销售超120台设备,计划融资300万美元并拓展美国市场。
这项由剑桥大学、清华大学和伊利诺伊大学合作的研究首次将扩散大语言模型引入语音识别领域,开发出Whisper-LLaDA系统。该系统具备双向理解能力,能够同时考虑语音的前后文信息,在LibriSpeech数据集上实现了12.3%的错误率相对改进,同时在大多数配置下提供了更快的推理速度,为语音识别技术开辟了新的发展方向。