开源向量数据库供应商 Qdrant 表示,通过使用 GPU 计算向量索引的速度可以比 x86 CPU 快 10 倍。
向量数据库存储着向量嵌入,这些嵌入是从文本短语、音频、图像和视频流片段中经过数学计算得出的编码 token。当大语言模型 (LLM) 响应用户的自然语言请求时,会搜索这些向量嵌入。搜索过程会在向量空间中寻找与搜索项相近的内容。要进行搜索,必须建立向量嵌入的索引。随着项目数量扩展到数十亿甚至更多,建立索引的计算强度会显著增加。Qdrant 在其最新的 v1.13 软件版本中支持使用 AMD、Intel 和 Nvidia 的 GPU 来构建此类索引。
Qdrant CTO 兼联合创始人 Andrey Vasnetsov 表示:"索引构建通常是向量搜索应用扩展的瓶颈。通过引入与平台无关的 GPU 加速,我们让索引构建变得更快、更具成本效益,同时为用户提供了选择最适合其需求的硬件的灵活性。"
该公司的索引技术基于 HNSW (分层可导航小世界) 算法,这是一种基于图的近似最近邻搜索技术,在许多向量数据库中都有应用。Qdrant 开发者关系总监 David Myriel 在博客中指出,Qdrant 是自主开发这款软件,而不是使用第三方代码。
他表示:"Qdrant 不需要高端 GPU 就能实现显著的性能提升",并提供了一个表格,显示了使用和不使用各种常见 GPU 的索引时间和成本比较。
下面是一个图表,直观展示了表格中两个时间列的比较:
v1.13 版本还包括以下特性:
严格模式:限制计算密集型操作,如未索引过滤、批处理大小和某些搜索参数。这有助于改善多租户工作效果。
HNSW 图压缩:通过 HNSW Delta 编码减少存储使用,只存储值之间的差异(即"增量")。
命名向量过滤:适用于在单个数据点中存储多个不同大小和类型的向量的情况。博客称:"这使得基于特定向量的存在来搜索数据点变得容易。例如,如果您的集合包含图像和文本向量,您可以只过滤出定义了图像向量的数据点。"
自定义存储:使用自定义存储后端代替 RocksDB,以防止随机延迟增加的压缩峰值,通过要求读写操作的磁盘操作数量保持恒定来确保一致的性能,而不受数据大小的影响。
Qdrant 表示,此版本为需要实时响应、频繁重新索引和能够对动态数据流做出即时决策的 AI 驱动应用创造了新的可能性,如实时搜索、个性化推荐和 AI 代理。
其向量数据库的安装量已超过 1000 万次。
好文章,需要你的鼓励
尽管市场上频繁出现所谓的自主代理 AI,但目前尚无统一定义,多数产品不过是 LLM 的简单包装,这让 CIO 在采购时面临风险与困惑。
最新研究发现,AI生成的代码常错误引用虚构依赖库,为供应链攻击提供契机,可能导致数据泄露、植入后门等恶意行为,严重威胁系统安全。
本文讨论了 IT 自动化过程中容易忽视的流程问题、数据质量、整合难题、成本误区以及 AI 融入后带来的监管与创新挑战。
构建云边端协同的多元化算力体系已成为企业实现大模型规模化落地的关键路径,Arm正助力从云到端的大模型部署与高效运行,满足企业对更高性能、更高能效以及更强本地处理能力的迫切需求。