开源向量数据库供应商 Qdrant 表示,通过使用 GPU 计算向量索引的速度可以比 x86 CPU 快 10 倍。
向量数据库存储着向量嵌入,这些嵌入是从文本短语、音频、图像和视频流片段中经过数学计算得出的编码 token。当大语言模型 (LLM) 响应用户的自然语言请求时,会搜索这些向量嵌入。搜索过程会在向量空间中寻找与搜索项相近的内容。要进行搜索,必须建立向量嵌入的索引。随着项目数量扩展到数十亿甚至更多,建立索引的计算强度会显著增加。Qdrant 在其最新的 v1.13 软件版本中支持使用 AMD、Intel 和 Nvidia 的 GPU 来构建此类索引。
Qdrant CTO 兼联合创始人 Andrey Vasnetsov 表示:"索引构建通常是向量搜索应用扩展的瓶颈。通过引入与平台无关的 GPU 加速,我们让索引构建变得更快、更具成本效益,同时为用户提供了选择最适合其需求的硬件的灵活性。"
该公司的索引技术基于 HNSW (分层可导航小世界) 算法,这是一种基于图的近似最近邻搜索技术,在许多向量数据库中都有应用。Qdrant 开发者关系总监 David Myriel 在博客中指出,Qdrant 是自主开发这款软件,而不是使用第三方代码。
他表示:"Qdrant 不需要高端 GPU 就能实现显著的性能提升",并提供了一个表格,显示了使用和不使用各种常见 GPU 的索引时间和成本比较。
下面是一个图表,直观展示了表格中两个时间列的比较:
v1.13 版本还包括以下特性:
严格模式:限制计算密集型操作,如未索引过滤、批处理大小和某些搜索参数。这有助于改善多租户工作效果。
HNSW 图压缩:通过 HNSW Delta 编码减少存储使用,只存储值之间的差异(即"增量")。
命名向量过滤:适用于在单个数据点中存储多个不同大小和类型的向量的情况。博客称:"这使得基于特定向量的存在来搜索数据点变得容易。例如,如果您的集合包含图像和文本向量,您可以只过滤出定义了图像向量的数据点。"
自定义存储:使用自定义存储后端代替 RocksDB,以防止随机延迟增加的压缩峰值,通过要求读写操作的磁盘操作数量保持恒定来确保一致的性能,而不受数据大小的影响。
Qdrant 表示,此版本为需要实时响应、频繁重新索引和能够对动态数据流做出即时决策的 AI 驱动应用创造了新的可能性,如实时搜索、个性化推荐和 AI 代理。
其向量数据库的安装量已超过 1000 万次。
好文章,需要你的鼓励
Nvidia 在最新的 CUDA 12.8 版本中宣布,Maxwell、Pascal 和 Volta 架构的支持将被冻结。这意味着一系列老旧显卡将逐步失去技术支持。虽然这些设备短期内仍可使用,但未来可能面临兼容性问题。此举将影响依赖这些旧型号的数据中心和科研机构。
随着AI的发展,高密度数据中心中高性能GPU的使用产生了大量热量。液冷成为唯一可行的散热方案,但其部署面临成本和风险concerns。通过分析液冷的必要性、经济效益和简化措施,数据中心团队可以为液冷技术的采用提供有力论据,从而保护高价值、高能耗的GPU机架。
微软推出基于 PostgreSQL 的开源文档数据库平台,并建议用户可以通过实施开源 FerretDB 解决方案来开始使用。这一举措展现了微软对开源世界的日益接受,旨在满足社区对 NoSQL 数据库的需求,同时提供完全开源、无商业许可费用的解决方案。
Commvault 与 CrowdStrike 达成战略合作,将 Falcon XDR 集成至 Commvault Cloud,以提升客户的网络威胁检测和响应能力。这一合作旨在加强数据保护、提高网络弹性,使企业能更快速地识别威胁、响应攻击,并有效降低网络安全风险。