开源向量数据库供应商 Qdrant 表示,通过使用 GPU 计算向量索引的速度可以比 x86 CPU 快 10 倍。
向量数据库存储着向量嵌入,这些嵌入是从文本短语、音频、图像和视频流片段中经过数学计算得出的编码 token。当大语言模型 (LLM) 响应用户的自然语言请求时,会搜索这些向量嵌入。搜索过程会在向量空间中寻找与搜索项相近的内容。要进行搜索,必须建立向量嵌入的索引。随着项目数量扩展到数十亿甚至更多,建立索引的计算强度会显著增加。Qdrant 在其最新的 v1.13 软件版本中支持使用 AMD、Intel 和 Nvidia 的 GPU 来构建此类索引。
Qdrant CTO 兼联合创始人 Andrey Vasnetsov 表示:"索引构建通常是向量搜索应用扩展的瓶颈。通过引入与平台无关的 GPU 加速,我们让索引构建变得更快、更具成本效益,同时为用户提供了选择最适合其需求的硬件的灵活性。"
该公司的索引技术基于 HNSW (分层可导航小世界) 算法,这是一种基于图的近似最近邻搜索技术,在许多向量数据库中都有应用。Qdrant 开发者关系总监 David Myriel 在博客中指出,Qdrant 是自主开发这款软件,而不是使用第三方代码。
他表示:"Qdrant 不需要高端 GPU 就能实现显著的性能提升",并提供了一个表格,显示了使用和不使用各种常见 GPU 的索引时间和成本比较。
下面是一个图表,直观展示了表格中两个时间列的比较:
v1.13 版本还包括以下特性:
严格模式:限制计算密集型操作,如未索引过滤、批处理大小和某些搜索参数。这有助于改善多租户工作效果。
HNSW 图压缩:通过 HNSW Delta 编码减少存储使用,只存储值之间的差异(即"增量")。
命名向量过滤:适用于在单个数据点中存储多个不同大小和类型的向量的情况。博客称:"这使得基于特定向量的存在来搜索数据点变得容易。例如,如果您的集合包含图像和文本向量,您可以只过滤出定义了图像向量的数据点。"
自定义存储:使用自定义存储后端代替 RocksDB,以防止随机延迟增加的压缩峰值,通过要求读写操作的磁盘操作数量保持恒定来确保一致的性能,而不受数据大小的影响。
Qdrant 表示,此版本为需要实时响应、频繁重新索引和能够对动态数据流做出即时决策的 AI 驱动应用创造了新的可能性,如实时搜索、个性化推荐和 AI 代理。
其向量数据库的安装量已超过 1000 万次。
好文章,需要你的鼓励
亚马逊云服务部门与OpenAI签署了一项价值380亿美元的七年协议,为ChatGPT制造商提供数十万块英伟达图形处理单元。这标志着OpenAI从研究实验室向AI行业巨头的转型,该公司已承诺投入1.4万亿美元用于基础设施建设。对于在AI时代竞争中处于劣势的亚马逊而言,这项协议证明了其构建和运营大规模数据中心网络的能力。
特拉维夫大学研究团队开发了SAEdit方法,使用稀疏自编码器实现精确的AI图像编辑控制。该技术能像调节音量一样精确控制编辑强度,实现从微笑到大笑的连续调节,同时确保编辑的高度解耦性,避免意外修改其他图像元素。方法具有出色的通用性,可应用于多个AI图像生成平台,为图像编辑领域带来重大突破。
当今最大的AI数据中心耗电量相当于一座小城市。美国数据中心已占全国总电力消费的4%,预计到2028年将升至12%。电力供应已成为数据中心发展的主要制约因素。核能以其清洁、全天候供电特性成为数据中心运营商的新选择。核能项目供应链复杂,需要创新的采购模式、标准化设计、早期参与和数字化工具来确保按时交付。
Code4Me V2是荷兰代尔夫特理工大学开发的开源AI编程助手平台,专为学术研究设计。它解决了商业AI编程工具透明度不足、无法获取交互数据的问题,提供了模块化架构和完整的数据收集框架。该工具性能可媲美商业产品,代码补全延迟仅186.31毫秒,同时支持内联补全和聊天功能。通过透明、可控制、可扩展的设计,为AI辅助编程研究提供了重要的基础设施平台。