MongoDB公司今日宣布推出一系列新功能,旨在帮助人工智能开发者和创业者更快地将应用程序从原型转向生产环境。
这些新功能包括Voyage 4系列嵌入模型的正式发布,以及MongoDB创业公司计划的扩展。新特性进一步加强了MongoDB核心数据库平台与去年收购Voyage AI公司所获得的检索和嵌入技术之间的集成。
嵌入技术是数据的数值表示形式,以向量形式捕获语义含义。它们使系统能够基于含义而非精确关键词来比较和检索信息,这对许多AI任务至关重要。
MongoDB核心产品和Atlas基础服务负责人Benjamin Cefalo表示:"客户越来越不把MongoDB仅仅视为数据库;他们将数据库重新定位为AI技术栈的基础。"
四种嵌入模型
Voyage 4系列嵌入模型现已通过MongoDB Atlas托管服务的应用程序编程接口提供,也可在MongoDB社区版本地部署中使用。
该系列包含多个模型,旨在平衡检索准确性、延迟和成本。包括用于通用目的的voyage-4、用于最高检索准确性的voyage-4-large、用于更低延迟和成本的voyage-4-lite,以及专为本地开发和测试设计的开源权重模型voyage-4-nano。
MongoDB表示,这些模型旨在通过减少在不同系统间移动或复制数据的需求,提高生产环境人工智能工作负载的检索准确性。
公司还宣布了voyage-multimodal-3.5的正式发布,该模型将对交错文本和图像的支持扩展到视频领域。该模型旨在简化从复杂文档和多媒体源中提取上下文的过程。
MongoDB产品经理Frank Liu表示:"这实现了跨多种内容类型的统一检索。你只需要一个嵌入模型而不是三个来处理不同的数据类型。同时还能提供更好的终端用户体验,系统能够理解用户所写内容、所看内容和所录制内容之间的关系。"
MongoDB表示,其操作数据库与检索模型之间更紧密的集成使开发者能够避免管理独立的向量数据库、管道和同步过程,这些过程可能带来延迟和操作风险。
自动化嵌入和开发工具
公司还为MongoDB社区向量搜索引入了自动化嵌入功能,目前处于公开预览阶段。该功能在数据插入、更新或查询时自动生成和存储嵌入,无需单独的嵌入管道或外部服务。
自动化嵌入功能今日已可用于MongoDB社区版,预计很快将在Atlas服务上提供。MongoDB表示该功能与其驱动程序以及LangChain和LangGraph等人工智能框架集成。
对于Atlas用户,MongoDB还推出了嵌入和重排序API,直接在平台内公开Voyage AI模型。
此外,用于MongoDB Compass和Atlas数据资源管理器的AI助手现已正式发布。该助手为查询优化和故障排除等常见数据操作提供自然语言指导。
MongoDB创业公司计划扩展
MongoDB创业公司计划帮助初期阶段公司将应用程序从初始开发扩展到全球部署,该计划通过扩大合作伙伴生态系统得到加强。公司表示,根据上月Pitchbook数据,参与该计划的创业公司总估值已超过2000亿美元。
通过该计划,符合条件的创业公司可以获得匹配积分、协调入驻和跨参与技术的联合支持资源。
首批合作伙伴包括Fireworks AI公司和Temporal Technologies公司。
Temporal首席执行官Samar Abbas表示,这项合作旨在简化分布式应用程序开发。"这使我们能够接触到重视强大数据基础的开发者社区。"
MongoDB表示,预计随着时间推移,将有更多合作伙伴和服务加入创业公司计划。
Q&A
Q1:Voyage 4系列嵌入模型有什么特点?
A:Voyage 4系列包含四个模型:voyage-4用于通用目的、voyage-4-large提供最高检索准确性、voyage-4-lite实现更低延迟和成本、voyage-4-nano是开源权重模型用于本地开发测试。这些模型旨在平衡检索准确性、延迟和成本需求。
Q2:MongoDB如何简化AI应用开发流程?
A:MongoDB通过整合数据库与嵌入技术,让开发者避免管理独立的向量数据库、管道和同步过程。新的自动化嵌入功能可在数据操作时自动生成和存储嵌入,无需单独的嵌入管道或外部服务。
Q3:MongoDB创业公司计划能为初创企业提供什么支持?
A:该计划为符合条件的创业公司提供匹配积分、协调入驻和联合支持资源。目前参与计划的创业公司总估值已超过2000亿美元,首批合作伙伴包括Fireworks AI和Temporal Technologies等公司。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。