开源向量数据库供应商 Qdrant 表示,通过使用 GPU 计算向量索引的速度可以比 x86 CPU 快 10 倍。
向量数据库存储着向量嵌入,这些嵌入是从文本短语、音频、图像和视频流片段中经过数学计算得出的编码 token。当大语言模型 (LLM) 响应用户的自然语言请求时,会搜索这些向量嵌入。搜索过程会在向量空间中寻找与搜索项相近的内容。要进行搜索,必须建立向量嵌入的索引。随着项目数量扩展到数十亿甚至更多,建立索引的计算强度会显著增加。Qdrant 在其最新的 v1.13 软件版本中支持使用 AMD、Intel 和 Nvidia 的 GPU 来构建此类索引。
Qdrant CTO 兼联合创始人 Andrey Vasnetsov 表示:"索引构建通常是向量搜索应用扩展的瓶颈。通过引入与平台无关的 GPU 加速,我们让索引构建变得更快、更具成本效益,同时为用户提供了选择最适合其需求的硬件的灵活性。"
该公司的索引技术基于 HNSW (分层可导航小世界) 算法,这是一种基于图的近似最近邻搜索技术,在许多向量数据库中都有应用。Qdrant 开发者关系总监 David Myriel 在博客中指出,Qdrant 是自主开发这款软件,而不是使用第三方代码。
他表示:"Qdrant 不需要高端 GPU 就能实现显著的性能提升",并提供了一个表格,显示了使用和不使用各种常见 GPU 的索引时间和成本比较。
下面是一个图表,直观展示了表格中两个时间列的比较:
v1.13 版本还包括以下特性:
严格模式:限制计算密集型操作,如未索引过滤、批处理大小和某些搜索参数。这有助于改善多租户工作效果。
HNSW 图压缩:通过 HNSW Delta 编码减少存储使用,只存储值之间的差异(即"增量")。
命名向量过滤:适用于在单个数据点中存储多个不同大小和类型的向量的情况。博客称:"这使得基于特定向量的存在来搜索数据点变得容易。例如,如果您的集合包含图像和文本向量,您可以只过滤出定义了图像向量的数据点。"
自定义存储:使用自定义存储后端代替 RocksDB,以防止随机延迟增加的压缩峰值,通过要求读写操作的磁盘操作数量保持恒定来确保一致的性能,而不受数据大小的影响。
Qdrant 表示,此版本为需要实时响应、频繁重新索引和能够对动态数据流做出即时决策的 AI 驱动应用创造了新的可能性,如实时搜索、个性化推荐和 AI 代理。
其向量数据库的安装量已超过 1000 万次。
好文章,需要你的鼓励
法国AI初创公司Mistral AI发布了首个大语言模型全面生命周期评估,量化了AI的环境代价。其Mistral Large 2模型训练产生20,400吨二氧化碳当量,消耗281,000立方米水。运营阶段占环境影响85%,远超硬件制造成本。研究表明地理位置和模型大小显著影响碳足迹,企业可通过选择适当规模模型、批处理技术和清洁能源部署来减少环境影响。这一透明度为企业AI采购决策提供了新的评估标准。
上海AI实验库推出YUME系统,用户只需输入一张图片就能创建可键盘控制的虚拟世界。该系统采用创新的运动量化技术,将复杂的三维控制简化为WASD键操作,并通过智能记忆机制实现无限长度的世界探索。系统具备强大的跨风格适应能力,不仅能处理真实场景,还能重现动漫、游戏等各种艺术风格的虚拟世界,为虚拟现实和交互娱乐领域提供了全新的技术路径。
许多人认为一旦实现通用人工智能(AGI)和人工智能超级智能(ASI),这些高度先进的AI将能够告诉我们人生的真正意义。然而,巅峰AI可能无法明确回答这个史诗般的问题。即使AI拥有人类所有知识,也不意味着能从中找到生命意义的答案。AI可能会选择提供多种可能性而非绝对答案,以避免分裂人类社会。
上海AI实验室研究团队开发了革命性的AI编程验证方法,让大语言模型能够在最小人工干预下自动生成和验证程序规范。该方法摒弃传统的人工标注训练,采用强化学习让模型在形式化语言空间中自主探索,在Dafny编程验证任务上显著超越现有方法,为AI自主学习开辟新道路。