Cloudian将Milvus向量数据库集成到HyperStore中用于AI推理

对象存储供应商Cloudian正在将Milvus向量数据库功能集成到其HyperStore软件中，作为AI数据平台路线图的一部分提供AI推理能力。HyperStore是一个对象存储系统，具有几乎无限的可扩展性并支持Nvidia的GPUDirect。向量数据库存储非结构化文档数据的多维方面的数学变换，以及向量化的音频、图像和视频数据。这些向量被大型语言模型用于在构建对用户请求的响应时搜索语义相关的向量。

对象存储供应商Cloudian正在将Milvus向量数据库功能添加到其HyperStore软件中，作为AI数据平台路线图的一部分提供AI推理能力。

HyperStore是一个对象存储系统，据Cloudian称，这是业内性能最高的系统，具有几乎无限的可扩展性，支持Nvidia的GPUDirect。向量数据库存储非结构化文档数据中Token化文本的多维方面的数学变换，也包括向量化的音频、图像和视频数据。大语言模型在构建对用户请求的响应时，使用这些向量来搜索语义相关的向量。

Cloudian首席技术官Neil Stobart表示："将数据存储和AI推理集成到一个高效平台中，代表了企业处理AI基础设施方法的根本转变。"

Cloudian指出，现代AI应用需要大量存储容量来存储可达PB级规模的向量数据集，以及支持索引文件和操作日志，同时需要超低延迟访问来进行实时推理操作。拥有独立的非结构化数据和向量存储意味着数据移动和独立的基础设施组件。该供应商表示，将两者结合意味着客户可以消除数据移动并降低部署企业级AI系统的复杂性。

该公司表示，虽然AI模型本身可能相对较小，但有意义的AI交互所需的上下文数据会产生巨大的存储需求。推理模型的KV缓存量预计到2026年将达到每个并发用户2-5TB。用户期望AI系统能够记住关于他们的一切——对话历史、偏好和上下文——可能需要存储数十亿用户长期的Token输入和输出。

由Zilliz创建和提供的开源Milvus向量数据库，存储、索引和查询由机器学习模型生成的高维向量嵌入，为十亿级向量数据集提供毫秒级查询响应时间。Cloudian将其用于相似性搜索和AI推理应用，包括推荐系统、计算机视觉、自然语言处理和检索增强生成（RAG）。

HyperStore作为统一的存储基础，处理原始数据、处理后的向量、模型工件和元数据

Milvus在辅助节点上运行，同时利用HyperStore进行向量索引和集合的持久存储

数据在存储和计算之间无缝流动，无传统多系统架构的瓶颈

并行处理能够在大规模向量数据集上进行数千个并发相似性搜索

Cloudian表示，其每节点35 GBps的HyperStore + Milvus提供EB级对象存储，支持"大规模向量数据集，同时保持实时推理工作负载的高性能访问"。与部署独立的存储和推理平台相比，客户的总拥有成本更低，管理更简化，数据移动成本降低。

HyperStore + Milvus支持本地和混合云部署。客户可以从小型AI试点项目开始，逐步扩展到生产工作负载。

Cloudian的AI数据平台愿景包括"统一的、加速的基础设施，无缝集成数据处理、存储和AI计算"。该公司声称，它将不再只提供存储基础设施，而是演进为数据处理平台，将基础设施升级为更广泛应用软件堆栈的存储部分。

Cloudian的集成AI推理软件现已可供评估。Cloudian博客补充道："初步测试显示推理吞吐量的显著改善，我们将在即将发布的性能分析中详细说明。"

来源：BLOCKS & FILES

0赞

好文章，需要你的鼓励

Cloudian将Milvus向量数据库集成到HyperStore中用于AI推理

来源：BLOCKS & FILES

2025

07/09

09:13

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

Deepgram推出Saga：为开发者打造的AI语音接口

Graphwise升级图数据库成为AI智能体的大脑

三星收购Xealth加速数字健康平台布局

企业AI应用最佳实践指南

车队未来：AI预测性维护预防故障

人工智能助力还是加剧气候危机？选择权在人类

ChatGPT词汇表：53个人工智能术语必知指南

ChatGPT正在测试神秘新功能"一起学习"

Capital One如何构建生产级多智能体AI工作流程来支持企业应用

Graid基于Nvidia GPU的RAID卡技术突破及产品路线图

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会