IBM 的并行文件系统 Storage Scale 现已包含内容感知功能,以增强其检索增强生成 (RAG) 能力。
Storage Scale 在高性能计算 (HPC) 和需要类似高速文件数据访问的企业用例中有着悠久的历史,包括大语言模型 (LLM) 训练和推理。Storage Scale v5.2.1 增加了高性能 S3 对象存储支持。该产品还支持 Nvidia 的 GPUDirect 主机服务器内存旁路协议。去年 9 月,IBM 将其 watsonx 数据湖仓与 Storage Scale 结合,在文件访问覆盖层下提供对象存储功能。目标是提高 AI 训练和推理工作负载的速度。
现在 IBM 已经扩展了与 Nvidia 的合作,宣布:
- 基于 Nvidia 的 AI-Q 蓝图和 NeMo Retriever 微服务构建的内容感知 Storage Scale (CAS) 功能。
- 通过支持 Nvidia NIM 微服务扩展 watsonx 集成,实现跨多个云环境的外部 AI 模型集成。IBM watsonx.governance 将允许企业监控和管理任何托管环境中的 NIM 微服务。
- AI focused 的 IBM 咨询能力,Nvidia 通过 Nvidia Blueprints 提供 AI 集成服务,使用 Red Hat OpenShift 和 Nvidia AI 优化混合云环境中的计算密集型 AI 工作负载。
- IBM Cloud 上提供 Nvidia H200 GPU 实例。
- Storage Scale 支持 Nvidia 的 AI 数据平台参考设计。
IBM 院士、副总裁兼首席技术官 Vincent Hsu 在谈到 CAS 时表示,它基于 IBM Research 和 Nvidia 的工作。由于 IBM 现在已经"在存储系统中嵌入了计算、数据管道和向量数据库功能,CAS 减少了数据移动和延迟,从而提高了效率。"
Storage Scale 可以从多个来源获取数据。它具有"全局数据抽象服务,旨在提供来自多个数据源和多个位置的连接,将数据从 IBM 和第三方存储环境引入您的 AI 工厂。"
CAS 可以使用 AI-Q 和 NeMo Retriever "从文本、图表、图形甚至图像中提取信息"。它能够"监视其他存储系统或云中的文件夹,以识别发生的变化,自动运行预构建的管道,并仅更新向量数据库中的变化,确保数据对 AI 应用程序是最新的,同时高效地使用 Nvidia 加速计算。"
IBM Storage Scale 将使用提取和增强的数据响应查询,通过 BlueField-3 DPU 和 Spectrum-X 网络加速 GPU 和存储之间的通信。
CAS 可以检测多个非结构化数据存储中的变化,将修改后的数据转换为向量,并将其提供给 AI 模型,以改善对用户或 AI 助手请求的 RAG 响应。正如 Hsu 所说:"通过应用创新的自然语言处理技术,我们开发了更有效地从各种内容中提取语义含义的方法,使更新 AI 工具变得更容易,从而提高答案的质量。"
Nvidia 存储网络技术副总裁 Rob Davis 表示:"AI 代理需要快速访问、获取和处理大规模数据,而今天,这些步骤发生在不同的孤岛中。IBM 的内容感知存储与 Nvidia AI 的集成在优化的网络结构中协调数据和计算,通过智能、可扩展的系统克服孤岛,实现近实时推理,从而实现响应式 AI 推理。"
Storage Scale 内容感知功能将嵌入到下一次 IBM Fusion 更新中,预计在第二季度全面上市。感兴趣的各方可以在这里注册参加定于 2025 年 4 月 8 日东部时间 11:00 举行的网络研讨会"AI First Storage – 通过内容感知存储增强 AI 结果"。
好文章,需要你的鼓励
美国网络安全和基础设施安全局指示联邦机构修补影响思科ASA 5500-X系列防火墙设备的两个零日漏洞CVE-2025-20362和CVE-2025-20333。这些漏洞可绕过VPN身份验证并获取root访问权限,已被黑客积极利用。攻击与国家支持的ArcaneDoor黑客活动有关,黑客通过漏洞安装bootkit恶意软件并操控只读存储器实现持久化。思科已发布补丁,CISA要求机构清点易受攻击系统并在今日前完成修补。
康考迪亚大学研究团队通过对比混合量子-经典神经网络与传统模型在三个基准数据集上的表现,发现量子增强模型在准确率、训练速度和资源效率方面均显著优于传统方法。研究显示混合模型的优势随数据集复杂度提升而增强,在CIFAR100上准确率提升9.44%,训练速度提升5-12倍,且参数更少。该成果为实用化量子增强人工智能铺平道路。
TimeWave是一款功能全面的计时器应用,超越了苹果自带时钟应用的功能。它支持创建流式计时器,让用户可以设置连续的任务计时,帮助专注工作。应用采用简洁的黑白设计,融入了Liquid Glass元素。内置冥想、番茄工作法、20-20-20护眼等多种计时模式,支持实时活动显示和Siri快捷指令。免费版提供基础功能,高级版需付费订阅。
沙特KAUST大学团队开发了专门针对阿拉伯语的AI模型家族"Hala",通过创新的"翻译再调优"技术路线,将高质量英语指令数据转化为450万规模的阿拉伯语语料库,训练出350M到9B参数的多个模型。在阿拉伯语专项测试中,Hala在同规模模型中表现最佳,证明了语言专门化策略的有效性,为阿拉伯语AI发展和其他语言的专门化模型提供了可复制的技术方案。