开源向量数据库和搜索初创公司Qdrant开发了一款轻量级向量数据库,专为在机器人、自助终端、移动设备和其他嵌入式系统上本地运行而设计。
Qdrant Edge使开发者能够在边缘设备上本地运行混合和多模态搜索,无需连接服务器进程或后台线程。边缘设备通常资源受限,具有高延迟、有限计算能力和最小网络访问。Qdrant在其Edge产品中实现了云原生向量数据库的核心功能。向量数据库被生成式AI模型用于响应基于自然语言的用户请求。
Qdrant首席执行官兼联合创始人André Zayarni表示:"开发者需要在做出许多决策的地方运行基础设施——在设备本身上。Qdrant Edge是专为嵌入式AI设计的全新向量搜索引擎。它将本地搜索、确定性性能和多模态支持融入到最小的运行时占用空间中。"
Qdrant表示,Edge产品提供了对生命周期、内存使用和进程内执行的完全控制,无需后台服务。它将支持进程内执行、高级过滤以及与实时智能体工作负载的兼容性。预想的应用包括具有多模态传感器输入的机器人导航、智能零售自助终端和销售点系统上的本地检索,以及在移动或嵌入式硬件上运行的隐私优先助手。
Qdrant最初将其向量存储在底层的RocksDB键值存储中,但由于固有的压缩导致随机延迟峰值,并发现由于选项过多而难以调优。因此,它用Rust开发了自己的Gridstore键值存储。这具有数据层来在固定大小块中存储值以进行快速查找,掩码层来跟踪已使用和未使用的块而无需压缩,以及间隙层来管理空间分配。
Qdrant表示,它已经看到了机器人和移动AI开发者的早期关注,这些开发者希望进行本地部署并获得比连接到中央或云向量数据库更好的性能,以及需要边缘隐私优先AI的公司。
我们了解到,从自助终端开发者的角度来看,拥有能够响应客户自然语言查询的系统可能是有利的。
Qdrant的Edge产品现在通过私有测试版提供。构建机器人、设备助手或嵌入式推理管道的团队可以在此申请。
好文章,需要你的鼓励
麻省理工学院研究团队发现大语言模型"幻觉"现象的新根源:注意力机制存在固有缺陷。研究通过理论分析和实验证明,即使在理想条件下,注意力机制在处理多步推理任务时也会出现系统性错误。这一发现挑战了仅通过扩大模型规模就能解决所有问题的观点,为未来AI架构发展指明新方向,提醒用户在复杂推理任务中谨慎使用AI工具。
继苹果和其他厂商之后,Google正在加大力度推广其在智能手机上的人工智能功能。该公司试图通过展示AI在移动设备上的实用性和创新性来吸引消费者关注,希望说服用户相信手机AI功能的价值。Google面临的挑战是如何让消费者真正体验到AI带来的便利,并将这些技术优势转化为市场竞争力。
中科院自动化所等机构联合发布MM-RLHF研究,构建了史上最大的多模态AI对齐数据集,包含12万个精细人工标注样本。研究提出批评式奖励模型和动态奖励缩放算法,显著提升多模态AI的安全性和对话能力,为构建真正符合人类价值观的AI系统提供了突破性解决方案。