Qumulo为其云数据平台推出了三项全新的AI相关软件功能:Helios AI智能体、CloudConnectAI加速器和AI网络,旨在实现管理、AI数据选择和传输的自主化优化。
这一创新理念基于AI可以改善软件固有的监控和管理整个数据基础设施性能的能力,并能选择性地缓存数据并将其传输到GPU服务器,无需密切的系统管理员级别控制。Qumulo的云数据平台软件可以在本地运行,也可以在AWS、Azure和Google云中原生运行,为非结构化数据提供统一的全局命名空间。这形成了一个云数据结构,三项新功能都是AI数据供应链的重要组成部分。
首席执行官Doug Gourlay表示:"当今的企业需要的不仅仅是存储——他们需要能够思考、适应和加速的系统。Helios为我们的客户提供对整个数据生态系统的预测性感知,Qumulo CloudConnect让他们的数据在任何需要洞察的地方流动,而AI网络重新定义了性能的可能性。这是下一代推理基础设施的基础。"
Helios智能体架构与功能
Helios是一个AI智能体,通过系统级遥测数据进行训练——包括本地和Qumulo在AWS、Azure和Google云中的实例——能够对Qumulo非结构化数据环境进行自我管理、自我诊断和自我优化。它每天接收来自基础设施的计算、存储、云和网络层的数十亿个事件,并将它们放入统一模型中。
Helios能够寻找和识别新出现的异常情况,预测即将出现的容量或性能问题,并在问题发生之前自动生成规范性建议或修复工作流程来解决这些新生问题。可以将其视为Qumulo数据基础设施的一种接近自动驾驶的超级巡航控制系统。
Helios支持MCP协议,从而将其影响力扩展到Qumulo的合作伙伴生态系统,"允许外部智能体和编排框架参与同一推理结构,创建真正自主的数据平台。"
CloudConnect AI加速器优化数据传输
CloudConnect AI加速器专注于将数据从Qumulo云数据结构存储移动到GPU服务器,使用NeuralCache技术进行预测性缓存,将GPU数据加载时间减少高达64%。Qumulo表示,它可以在几分钟内部署到任何主要云、区域或可用性区域,并充当云数据结构的临时读/写辐条。
该系统可以根据需要从一个实例扩展到数百个实例,并动态优化数据路径,确保数据仅在需要时和需要的地方移动,具有最小延迟且无需手动编排。训练、推理和推理工作负载可以访问单一数据真实源,公司表示具有"严格的数据安全性、治理和控制。"
AI网络提升数据传输性能
AI网络引入了专为在GPU服务器上运行的AI训练、推理和推理工作负载调优的新数据移动器。这些数据移动器原生支持RDMA(远程直接内存访问)、基于融合以太网v2的RDMA(RoCEv2)和基于RDMA的NFS,基于RDMA的S3正在开发中。它们"在存储和加速计算集群之间提供接近内存带宽,显著减少大规模AI操作的延迟和CPU开销。"
这些数据移动器实现了"与Nvidia DGX、AMD Instinct和其他GPU丰富的计算基础设施的无缝集成。"
Qumulo的三项新功能从今天开始为特定客户提供预览版,并将在下个季度全面上市。在SC25展会的4407号展位将进行演示,Qumulo解决方案工程师可以为HPC和AI工作流程提供实践建议。
Q&A
Q1:Helios AI智能体是什么?它有什么功能?
A:Helios是Qumulo开发的AI智能体,通过系统级遥测数据训练,能够对非结构化数据环境进行自我管理、自我诊断和自我优化。它每天处理数十亿个事件,能识别异常情况,预测容量或性能问题,并自动生成修复建议。
Q2:CloudConnect AI加速器如何提升GPU数据处理效率?
A:CloudConnect AI加速器使用NeuralCache技术进行预测性缓存,将数据从云数据结构存储快速传输到GPU服务器,可将GPU数据加载时间减少高达64%。它能动态优化数据路径,确保数据仅在需要时移动,实现最小延迟。
Q3:AI网络功能支持哪些技术标准?
A:AI网络的数据移动器原生支持RDMA(远程直接内存访问)、RoCEv2(基于融合以太网v2的RDMA)和基于RDMA的NFS,基于RDMA的S3正在开发中。能够与Nvidia DGX、AMD Instinct等GPU计算基础设施无缝集成。
好文章,需要你的鼓励
计算机历史博物馆软件馆长Al Kossow成功恢复了上月在犹他大学发现的半世纪前磁带内容。UNIX V4是首个内核用C语言编写的UNIX操作系统版本,已从1970年代九轨磁带中成功恢复。现可从互联网档案馆下载并在SimH中运行。该版本包含约5.5万行代码,其中2.5万行为C语言,内核仅27KB大小。恢复过程使用了readtape程序采样原始磁通变化进行数据重建。
新加坡南洋理工大学研究团队提出"棱镜假设",认为图像可像光谱一样分解为不同频率成分,低频承载语义信息,高频包含视觉细节。基于此开发的统一自编码系统UAE,通过频率域分解成功统一了图像理解和生成能力,在多项基准测试中超越现有方法,为构建真正统一的视觉AI系统提供了新思路,有望推动计算机视觉技术向更智能统一的方向发展。
亚马逊云服务宣布其存储网关现已支持Nutanix的AHV虚拟化管理程序,进一步扩展混合云存储解决方案。此前AWS存储网关已支持VMware ESXi、微软Hyper-V和Linux KVM。由于AHV基于KVM架构,AWS表示添加支持相对容易。随着Broadcom收购VMware后策略调整,许多企业正寻求替代方案,Nutanix成为热门选择。分析师预测VMware可能在三年内失去35%的工作负载。
芝加哥伊利诺伊大学团队提出QuCo-RAG技术,通过检查AI训练数据统计信息而非内部信号来检测AI回答可靠性。该方法采用两阶段验证:预检查问题实体频率,运行时验证事实关联。实验显示准确率提升5-14个百分点,在多个模型上表现稳定,为AI可靠性检测提供了客观可验证的新方案。