Qdrant 发布搭载 GPU 的向量数据库,承诺索引速度提升 10 倍

开源向量数据库供应商 Qdrant 宣布利用 GPU 计算向量索引,速度比 x86 CPU 快 10 倍。最新版本支持 AMD、Intel 和 NVIDIA GPU,可大幅提升索引构建效率,降低成本。此外还引入了严格模式、图压缩等新功能,为 AI 应用提供更好的实时性能和扩展能力。

开源向量数据库供应商 Qdrant 表示,通过使用 GPU 计算向量索引的速度可以比 x86 CPU 快 10 倍。

向量数据库存储着向量嵌入,这些嵌入是从文本短语、音频、图像和视频流片段中经过数学计算得出的编码 token。当大语言模型 (LLM) 响应用户的自然语言请求时,会搜索这些向量嵌入。搜索过程会在向量空间中寻找与搜索项相近的内容。要进行搜索,必须建立向量嵌入的索引。随着项目数量扩展到数十亿甚至更多,建立索引的计算强度会显著增加。Qdrant 在其最新的 v1.13 软件版本中支持使用 AMD、Intel 和 Nvidia 的 GPU 来构建此类索引。

Qdrant CTO 兼联合创始人 Andrey Vasnetsov 表示:"索引构建通常是向量搜索应用扩展的瓶颈。通过引入与平台无关的 GPU 加速,我们让索引构建变得更快、更具成本效益,同时为用户提供了选择最适合其需求的硬件的灵活性。"

该公司的索引技术基于 HNSW (分层可导航小世界) 算法,这是一种基于图的近似最近邻搜索技术,在许多向量数据库中都有应用。Qdrant 开发者关系总监 David Myriel 在博客中指出,Qdrant 是自主开发这款软件,而不是使用第三方代码。

他表示:"Qdrant 不需要高端 GPU 就能实现显著的性能提升",并提供了一个表格,显示了使用和不使用各种常见 GPU 的索引时间和成本比较。

下面是一个图表,直观展示了表格中两个时间列的比较:

v1.13 版本还包括以下特性:

严格模式:限制计算密集型操作,如未索引过滤、批处理大小和某些搜索参数。这有助于改善多租户工作效果。

HNSW 图压缩:通过 HNSW Delta 编码减少存储使用,只存储值之间的差异(即"增量")。

命名向量过滤:适用于在单个数据点中存储多个不同大小和类型的向量的情况。博客称:"这使得基于特定向量的存在来搜索数据点变得容易。例如,如果您的集合包含图像和文本向量,您可以只过滤出定义了图像向量的数据点。"

自定义存储:使用自定义存储后端代替 RocksDB,以防止随机延迟增加的压缩峰值,通过要求读写操作的磁盘操作数量保持恒定来确保一致的性能,而不受数据大小的影响。

Qdrant 表示,此版本为需要实时响应、频繁重新索引和能够对动态数据流做出即时决策的 AI 驱动应用创造了新的可能性,如实时搜索、个性化推荐和 AI 代理。

其向量数据库的安装量已超过 1000 万次。

来源:BLOCKS & FILES

0赞

好文章,需要你的鼓励

2025

01/27

16:29

分享

点赞

邮件订阅