对象存储供应商Cloudian正在将Milvus向量数据库功能添加到其HyperStore软件中,作为AI数据平台路线图的一部分提供AI推理能力。
HyperStore是一个对象存储系统,据Cloudian称,这是业内性能最高的系统,具有几乎无限的可扩展性,支持Nvidia的GPUDirect。向量数据库存储非结构化文档数据中Token化文本的多维方面的数学变换,也包括向量化的音频、图像和视频数据。大语言模型在构建对用户请求的响应时,使用这些向量来搜索语义相关的向量。
Cloudian首席技术官Neil Stobart表示:"将数据存储和AI推理集成到一个高效平台中,代表了企业处理AI基础设施方法的根本转变。"
Cloudian指出,现代AI应用需要大量存储容量来存储可达PB级规模的向量数据集,以及支持索引文件和操作日志,同时需要超低延迟访问来进行实时推理操作。拥有独立的非结构化数据和向量存储意味着数据移动和独立的基础设施组件。该供应商表示,将两者结合意味着客户可以消除数据移动并降低部署企业级AI系统的复杂性。
该公司表示,虽然AI模型本身可能相对较小,但有意义的AI交互所需的上下文数据会产生巨大的存储需求。推理模型的KV缓存量预计到2026年将达到每个并发用户2-5TB。用户期望AI系统能够记住关于他们的一切——对话历史、偏好和上下文——可能需要存储数十亿用户长期的Token输入和输出。
由Zilliz创建和提供的开源Milvus向量数据库,存储、索引和查询由机器学习模型生成的高维向量嵌入,为十亿级向量数据集提供毫秒级查询响应时间。Cloudian将其用于相似性搜索和AI推理应用,包括推荐系统、计算机视觉、自然语言处理和检索增强生成(RAG)。
HyperStore作为统一的存储基础,处理原始数据、处理后的向量、模型工件和元数据
Milvus在辅助节点上运行,同时利用HyperStore进行向量索引和集合的持久存储
数据在存储和计算之间无缝流动,无传统多系统架构的瓶颈
并行处理能够在大规模向量数据集上进行数千个并发相似性搜索
Cloudian表示,其每节点35 GBps的HyperStore + Milvus提供EB级对象存储,支持"大规模向量数据集,同时保持实时推理工作负载的高性能访问"。与部署独立的存储和推理平台相比,客户的总拥有成本更低,管理更简化,数据移动成本降低。
HyperStore + Milvus支持本地和混合云部署。客户可以从小型AI试点项目开始,逐步扩展到生产工作负载。
Cloudian的AI数据平台愿景包括"统一的、加速的基础设施,无缝集成数据处理、存储和AI计算"。该公司声称,它将不再只提供存储基础设施,而是演进为数据处理平台,将基础设施升级为更广泛应用软件堆栈的存储部分。
Cloudian的集成AI推理软件现已可供评估。Cloudian博客补充道:"初步测试显示推理吞吐量的显著改善,我们将在即将发布的性能分析中详细说明。"
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。