人工智能原型转向生产环境的过程涉及众多环节,很容易陷入瓶颈。为了打破这一僵局,数据库服务提供商MongoDB本周发布了一系列新功能,旨在帮助开发者更快速、更准确地构建和实施AI解决方案。
基于近一年前收购Voyage AI的成果,该公司宣布正式推出Voyage 4嵌入模型系列,专门用于简化关键AI任务的信息检索流程。
MongoDB首席执行官CJ Desai在周四于旧金山举行的发布会上表示:"从我的角度来看,速度至关重要。你是否在尽可能快地构建?如果落后了,投资者或客户会质疑你公司的未来。"
利用向量搜索的未来
MongoDB对嵌入模型的关注凸显了向量搜索日益增长的重要性。嵌入技术将语义含义捕获为向量,将文本、图像或音频等形式的数据转换为数值表示,为现代AI应用提供动力。
该公司相信这种方法将吸引那些寻求更高检索质量、更低存储成本和更少摩擦的开发者。
MongoDB AI领域首席技术官Pete Johnson在周四的简报中说:"向量搜索是新的前沿领域。构建优秀AI应用的关键在于掌握向量搜索技术。"
MongoDB收购Voyage AI以及本周的发布表明了数据库处理AI工作负载方式的转变。检索和向量搜索过去一直作为独立解决方案进行管理。通过将这些功能直接嵌入其核心Atlas平台,MongoDB反映了行业将AI任务整合到数据库中以简化开发和改善人工智能效果的更广泛趋势。
MongoDB Voyage AI研究经理Frank Liu在接受采访时表示:"从数据中获取洞察需要通过嵌入技术实现。我们确实仍处于向量搜索的早期阶段。"
专业化的AI用例
MongoDB最新发布的产品也为来年AI可能的发展方向提供了一扇窗口。在周四的活动中,Desai与红杉资本合伙人Konstantine Buhler讨论了2025年AI产品通过智能体和前沿模型的发展进程。根据Buhler的观点,来年企业内部AI使用方式将发生转变。
"2026年将是AI专业化的一年,"Buhler说。"我们将看到专业化模型和专业化用例的出现。"
事实上,MongoDB已经看到了这一趋势。该公司本周宣布的项目中包括扩展其初创企业计划,这一举措旨在帮助小公司的创始人和开发者将应用推向全球部署。
MongoDB初创企业计划的公司目前总估值超过2000亿美元,包括利用AI模型简化招聘流程的Mercor以及提供AI驱动的SaaS管理的Spendflo。
MongoDB企业投资和企业发展副总裁Suraj Patel表示:"MongoDB起步时就是为初创企业提供支持。我们开始看到一些有趣的专业化模型。"
数据策略的发展势头
MongoDB利用Voyage AI收购、专注向量搜索并构建初创生态系统的策略在近几个月显示出积极的财务势头。该公司在12月报告了强劲的财季表现,扭转了一年前的亏损局面,收入同比增长19%。
该公司聘用Desai也是相当新的发展。这位CEO在周四的讲话中提到,他上任已满62天。Desai是行业资深人士,职业生涯始于甲骨文公司,随后在赛门铁克、戴尔/EMC、ServiceNow和Cloudflare等公司担任高级管理职务,于11月接任MongoDB掌门人。
"这个数据库是为构建者和开发者创建的,"Desai说。"我们负责处理所需的所有数据元素。"
处理数据元素意味着重新定义AI驱动的搜索和检索预期。该公司的方法以理解开发者痛点为指导,然后通过Voyage和Atlas提供一套解决方案,满足在复杂多变的AI世界中对简化需求的要求。
MongoDB核心产品和Atlas基础服务高级副总裁Ben Cefalo表示:"这为我们在开发者社区中带来了巨大的相关性。关键在于将各个部分连接起来。这对开发者来说非常棒,因为他们现在可以继续专注于构建。"
Q&A
Q1:Voyage 4嵌入模型有什么特点和用途?
A:Voyage 4是MongoDB推出的嵌入模型系列,专门用于简化关键AI任务的信息检索流程。它能将文本、图像或音频等数据转换为数值表示,为现代AI应用提供动力,帮助开发者实现更高检索质量、更低存储成本。
Q2:向量搜索为什么对AI应用这么重要?
A:向量搜索被称为新的前沿领域,是构建优秀AI应用的关键技术。嵌入技术通过将语义含义捕获为向量,能够更好地理解和处理数据,从而提升AI应用的性能和准确性。
Q3:MongoDB在AI领域的策略重点是什么?
A:MongoDB的AI策略主要包括三个方面:利用收购的Voyage AI技术提供嵌入模型服务、专注向量搜索技术发展、构建初创企业生态系统。通过将AI功能直接集成到Atlas平台,简化开发流程并改善AI应用效果。
好文章,需要你的鼓励
火箭实验室(Rocket Lab)宣布计划以现金加股票方式,斥资80亿美元收购主要卫星运营商铱星通信(Iridium Communications),交易预计于2027年中完成。铱星目前运营着由66颗活跃低轨卫星组成的星座网络,拥有约255万活跃用户,2024年营收达8.717亿美元。收购完成后,Rocket Lab计划借助其新型重型运载火箭Neutron及Lightning卫星平台,扩大铱星星座规模,开拓未被覆盖的市场并降低发射成本。
腾讯等机构提出ViQ框架,通过两阶段渐进量化训练,让离散视觉编码在多模态理解和图像重建上同时追平连续特征编码器,训练速度最高提升70%。
音乐流媒体平台Tidal宣布,将于7月中旬启用自动化工具,对完全由AI生成的音乐添加"AI"标识,并移除具有欺诈性质的曲目。平台还将取消AI生成音乐的版税资格,仅向真人创作、演唱的原创音乐开放变现渠道。此外,Tidal明确将高频异常上传、干扰真实艺术家等行为列为欺诈活动。Deezer、Spotify等竞争对手此前已推出类似检测机制,流媒体行业正加速构建AI内容治理体系。
香港科技大学与华为联合提出LISA训练方法,通过让副网络对齐"似然分数",将ControlNet等图像生成模型的训练收敛速度提升逾2.78倍,同时改善图像质量与条件控制精度。