近期 Nvidia 的股价遭受重创,但在人工智能 (AI) 硬件市场中仍然占据主导地位。在公司最新发布的 AI 数据平台中,"主动式 AI" 和"推理"成为最新的热门词汇,各大存储供应商也纷纷追随其后。
在加利福尼亚州圣何塞举行的 GTC 2025 大会上,Nvidia 的核心发布产品是面向 AI 数据中心处理的下一代 Blackwell Ultra 图形处理器 (GPU)。该产品专为 DeepSeek R1 等推理模型设计,可提升内存和推理性能。
以 Blackwell Ultra 为核心,Nvidia 还展望了 GB/NVL 产品线中一系列机架级平台产品,以及新的 DGX 系列 SuperPod 集群、工作站、网络接口卡 (NIC)、笔记本电脑 GPU 等产品。
这些举措某种程度上是对 DeepSeek 比 ChatGPT 更高效且对 GPU 需求更低这一现象的回应。Nvidia 利用这一消息强调,我们需要更快的 AI 处理能力来充分发挥其潜力。
对大型存储供应商来说,这些输入/输出需求就像制药公司需要疾病一样重要。AI 训练和推理需要处理海量数据,这就需要大量存储设备,并且要求具备非常高的数据访问速度和容量。
因此,GTC 2025 存储领域的核心公告是 Nvidia AI 数据平台参考架构,该架构允许第三方供应商(尤其是存储厂商)按照 GPU 巨头的规格构建设备,以支持包括主动式和推理技术在内的工作负载。
与 Nvidia 合作的厂商包括 DDN、Dell、HPE、Hitachi Vantara、IBM、NetApp、Pure Storage、Vast Data 和 Weka。
这些存储厂商在 GTC 期间的具体发布内容如下:
DDN 推出了 Inferno 高速对象存储设备,将 Nvidia 的 Spectrum-X 交换机添加到 DDN Infinia 存储中。Infinia 基于键值存储,目前仅支持 S3 对象存储访问协议。
Dell 发布了一系列产品,包括面向 AI 用例的 20 petaflop 级 PC。在存储方面,重点是其 PowerScale 横向扩展文件系统现已通过 Nvidia 云合作伙伴计划企业 AI 工厂部署验证。
HPE 重点推出了新的"统一数据层",该层将覆盖企业的结构化和非结构化数据,同时宣布了一些升级,即在其 MP B10000 阵列中实现统一块存储和文件访问。
Hitachi Vantara 借此机会推出了 Hitachi iQ M 系列,该系列结合了其虚拟存储平台 One (VSP One) 存储和 Nvidia AI Enterprise 软件,并将集成 Nvidia AI 数据平台参考设计,面向主动式 AI。
IBM 宣布了与 Nvidia 的新合作,包括基于 Nvidia AI 数据平台参考设计的计划集成。IBM 计划为其混合云基础设施产品 IBM Fusion 推出内容感知存储功能,并将扩展其 Watsonx 集成。此外,还计划为 AI 客户项目提供新的 IBM 咨询能力。
NetApp 宣布获得 Nvidia SuperPOD 验证。特别是 AFF A90 产品获得了 DGX SuperPOD 验证。同时,NetApp 的 AIPod 获得了新的 Nvidia 认证存储认证,以支持 Nvidia 企业参考架构。
Pure Storage 在发布 FlashBlade//Exa 之后,趁机宣布与 Nvidia AI 数据平台的兼容性。
Vast Data 推出了企业级 AI Stack,该产品结合了 Vast 的 InsightEngine 和 Nvidia DGX 产品、BlueField-3 DPU 以及 Spectrum-X 网络。
Weka 宣布已获得 Nvidia GB200 部署的数据存储认证。WEKApod Nitro 数据平台设备已通过 Nvidia 云合作伙伴 (NCP) 部署认证,支持 HGX H200、B200 和 GB200 NVL72 产品。
好文章,需要你的鼓励
新加坡人工智能机构与阿里云发布全新大语言模型Qwen-Sea-Lion-v4,专门针对东南亚语言和文化特色进行优化。该模型结合阿里云Qwen3-32B基础模型和大量东南亚地区数据集,在东南亚语言模型评估榜单中位居开源模型首位。模型支持119种语言,能在32GB内存的消费级笔记本上运行,采用字节对编码技术更好处理非拉丁文字,并具备3.2万词元上下文长度,可执行文档级推理和摘要任务。
中科大联合快手等机构推出VR-Thinker技术,首次实现AI视频评判员的"边看边想"能力。该系统通过主动选择关键画面、智能记忆管理和三阶段训练,在视频质量评估准确率上达到75%-82%,特别擅长处理长视频场景,为AI视频生成的质量控制提供了突破性解决方案。
AI智能体是下一代业务自动化工具,不仅能对话交流,还能执行复杂任务。与ChatGPT聊天机器人不同,它们可在最少人工干预下规划并完成工作。文章介绍了五个高影响力应用:自动化客户服务解决方案、销售CRM管理、合规自动化、招聘筛选与排程、市场情报报告。这些应用都具有重复性工作流程、依赖结构化数据、遵循可预测规则等特点,能够释放员工宝贵时间用于更有价值的工作。
微软研究院发布BitDistill技术,通过三阶段优化将大型语言模型压缩至1.58位精度,在保持性能的同时实现10倍内存节省和2.65倍速度提升。该技术包括模型结构稳定化、持续预训练适应和知识蒸馏传承三个关键步骤,解决了模型量化中的性能衰减和规模化问题,为AI模型在资源受限设备上的高效部署提供了新方案。