大语言模型(LLM)尽管技术能力强大,却长期面临一个棘手的记忆问题:它们往往无法在多轮对话中保留上下文,也缺乏访问相关数据的有效机制,最终导致输出结果不够可靠,难以取信于用户。
NoSQL数据库领域的先驱MongoDB正着手解决这一问题,推出了持久化记忆、检索、嵌入及重排序等一系列新功能,并将其整合至统一平台之中。与此同时,该公司还引入了新的安全连接方式、开源插件及其他框架集成,以支持智能体AI工作负载。
"释放智能体的潜力,记忆是关键,"MongoDB首席AI技术官Pete Johnson在媒体发布会上表示,"就像人类记忆一样,良好的智能体记忆能够对知识进行有效组织,帮助智能体根据上下文检索正确的知识,并随着时间推移学会做出更明智的决策、执行更优化的行动。"
为推进自动化检索与智能体持久记忆能力,MongoDB在其向量搜索功能中新增了自动化Voyage AI嵌入支持,目前该功能已进入公开预览阶段。
AI技术栈碎片化是另一大挑战。面对这一问题,开发者往往不得不承受MongoDB首席产品官Ben Cefalo所称的"同步税"——为了让数据能够被智能体检索,开发者必须将因子搜索、操作数据存储、嵌入模型和缓存等组件拼接在一起,并耗费大量时间构建复杂的数据管道,以保持各系统之间的数据同步。
然而,通过将Voyage AI原生集成至Atlas,MongoDB将"一个需要数周的工程项目压缩为两分钟的配置工作",Cefalo如此表示。开发者可以更快、更轻松地交付可靠、可信的智能体,"无需繁琐的数据管道搭建"。
与此相呼应,该公司还宣布LangGraph.js长期记忆存储功能正式全面上线。Cefalo指出,JavaScript和TypeScript用户构成了全球规模最大的开发者社群,但过去MongoDB现有的Python集成将这些用户限制在短期、单线程的使用场景中。
现在,他们可以借助MongoDB为智能体赋予持久化的长期记忆,使其在跨对话场景中保留用户偏好和交互历史,且"运行在他们早已信赖的数据管道之上"。Cefalo表示,这也进一步体现了MongoDB长期以来坚持的"随处运行"战略。
Johnson指出,智能体必须能够依据上下文检索信息,并在此过程中不断学习和优化,同时尽可能降低大语言模型的Token消耗——因为一旦检索精度不稳定,用户的信任感就会随之丧失。
他表示,大多数用户会错误地将这种不信任感归咎于大语言模型本身,"直觉反应是升级到最新、功能最全、价格最高的模型"。但归根结底,这是一个检索问题:模型只能基于输入的信息做出回应;如果数据不准确、已过时或缺乏上下文,输出结果最终必然出错,从而给企业带来可能"灾难性"的后果。
"这正是我们从客户那里听到的心声:他们对AI智能体感到兴奋,但如果结果不稳定、不相关甚至完全错误,他们不敢将其推向自己的客户,"Johnson说道。
解决方案在于预先为大语言模型提供所需的正确信息,而嵌入模型与重排序模型正是为此而生。MongoDB正将这些技术整合至其Voyage 4系列模型中,这一布局建立在2025年2月收购Voyage AI的基础之上。
正如Johnson所解释的,嵌入模型能够将PDF、图像、视频、音频等非结构化信息转化为向量,从而捕捉并映射数据的语义关系,并将相关数据归类聚合。"这就是为什么你可以对非精确关键词的内容进行语义风格的搜索。"
重排序模型则在此基础上更进一步。嵌入模型完成初步检索后,重排序模型会将检索结果与用户查询进行比对,从而提供更相关、更有依据的回应。"把嵌入模型想象成一张大网,而重排序模型则从中精挑细选出最好的鱼,"Johnson形象地比喻道。
嵌入与重排序功能均已原生集成至MongoDB,企业客户无需在多个供应商之间来回切换,也不会因"拼凑技术栈"而陷入运维困境。
Johnson还特别强调,技术领导者当下对数据平台所做的选择,将直接决定AI开发的速度——是加速推进,还是延误数月乃至数年。"这不是未来才需要考虑的问题,而是今天就要面对的问题,因为AI开发的成败,取决于所使用的数据平台,"他说道。
除新记忆功能外,MongoDB还在强化其数据基础底座。最新版本的数据库MongoDB 8.3已正式全面发布,代表了对其核心产品的"深层架构强化",旨在以更低成本支撑更快速的AI工作负载,Cefalo解释道。
查询表达式(用于检索和组织数据的指令)已原生集成至MongoDB,开发者无需依赖外部工具箱,转换逻辑可直接在数据库内部完成。"这是面向数据工程师的SQL风格数据转换能力,"Cefalo表示。
此外,MongoDB还宣布Atlas与Feast完成集成。这一被广泛采用的开源特征存储在训练和推理过程中为AI和大语言模型应用提供结构化数据。这意味着机器学习团队无需再玩"高风险的数据库轮椅游戏"——将数据从主训练数据库迁移到独立系统进行实时推理,Cefalo表示。
"数据库蔓延不仅带来运维负担,还会造成数据漂移——模型在一套现实数据上训练,却在另一套数据上做预测,"他说道。这种情况不仅复杂且成本高昂,更是AI规模化扩展的一大障碍。
最后,为支持安全与合规需求,MongoDB通过AWS PrivateLink为MongoDB Atlas提供跨区域连接支持。AWS PrivateLink支持AWS服务、虚拟私有云(VPC)及本地网络之间的互联互通,且无需将流量暴露于公共互联网。这一集成现已全面上线,能够提供"单一、可审计的模型",帮助跨多区域运营的组织简化合规流程,同时维持强健的安全态势,Cefalo解释道。
Q&A
Q1:MongoDB新发布的AI功能主要解决什么问题?
A:MongoDB此次发布的新功能主要针对大语言模型(LLM)的检索与记忆问题。大语言模型往往无法在多轮对话中保留上下文,也缺乏访问相关数据的有效机制,导致输出不可靠。MongoDB通过推出持久化记忆、自动化嵌入、重排序等功能,并将其整合至统一平台,帮助智能体在跨对话场景中保留用户偏好和交互历史,提升检索准确性和结果可信度。
Q2:MongoDB的Voyage AI嵌入和重排序功能是怎么工作的?
A:嵌入模型将PDF、图像、视频、音频等非结构化信息转化为向量,捕捉数据的语义关系,从而支持语义风格的搜索,而不仅限于精确关键词匹配。重排序模型则在初步检索完成后,将结果与用户查询进行对比,筛选出最相关的内容。两者结合,可以理解为:嵌入模型像一张大网,重排序模型则从中精挑细选出最优结果,最终提供更准确、更有依据的回应。
Q3:MongoDB 8.3版本有哪些重要更新?
A:MongoDB 8.3是其数据库产品的最新正式版本,代表对核心架构的"深层强化",目标是以更低成本支持更快速的AI工作负载。该版本将查询表达式原生集成至数据库中,开发者无需依赖外部工具,数据转换逻辑可直接在数据库内部完成,提供类似SQL风格的数据转换能力,方便数据工程师使用。此外,还新增了与开源特征存储Feast的集成,避免数据在训练和推理阶段发生漂移。
好文章,需要你的鼓励
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
谷歌在Android Show发布会上宣布,将Gemini更深度整合至Android系统,推出名为"Gemini Intelligence"的升级功能。该功能可跨应用处理日常任务,包括自动填写表单、安排日程、生成购物清单及自定义小组件等,无需用户频繁切换应用。此外,Gboard新增"Rambler"功能,可自动过滤语音输入中的口误和填充词。Gemini Intelligence将率先登陆三星Galaxy和谷歌Pixel手机,并支持Android Auto、Wear OS及智能眼镜。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。