数据库公司 Couchbase Inc. 通过与 Nvidia Corp. 的 NIM 微服务集成,增强了其人工智能代理构建工具 Capella AI Model Services 的功能。
此次更新将使 Couchbase Capella 数据库用户更容易创建所谓的主动式 AI 应用程序。这类应用程序超越了传统聊天机器人的能力,能够以最少的监督代表用户执行任务。
Couchbase 在去年 12 月推出 Capella AI Services 时引入了 Capella AI Model Services,表示这些服务可以帮助简化 AI 代理的开发。它们还提供了在支持这些 AI 代理的大语言模型中创建和嵌入托管端点的工具,确保它们能够满足组织的性能、延迟和隐私要求。
Couchbase Capella 是开源 Couchbase NoSQL 数据库的云版本。与 Oracle 等传统数据库相比,其主要优势在于能够处理结构化和非结构化信息,这使其成为需要访问这两种类型数据的 AI 应用程序的理想选择。它还可以作为数据缓存。
借助 NIM 实现高性能 AI 代理
NIM (Nvidia Inference Microservices) 将优化的推理引擎、行业标准应用程序编程接口和预测试的大语言模型打包到软件容器中,便于部署。其他打包工具包括 Nvidia 的 NeMo Guardrails,有助于实施策略并防止 AI 产生幻觉。此外,它还允许组织引入自己的专有数据来实现检索增强生成,并增强其大语言模型的知识。
通过将 Capella AI Model Services 与 NIM 集成,Couchbase 表示客户可以让他们的 AI 代理更接近底层数据和支持它们的图形处理单元。这意味着他们可以构建具有更高吞吐量和更大模型灵活性的 AI 应用程序。
Couchbase 产品和合作伙伴高级副总裁 Matt McDonough 表示,AI 代理需要一个统一且高性能的数据平台,以支持应用程序开发生命周期的每个步骤。
"我们为客户提供了以安全和受控方式运行其首选 AI 模型的灵活性,同时为 AI 工作负载提供更好的性能,并实现 AI 与事务性和分析性数据的无缝集成,"他解释道。
McDonough 表示,这是必要的,因为企业在 AI 代理的可靠性和合规性方面经常面临挑战。他说,让 AI 代理正确运行很重要,特别是如果要在面向客户的应用程序中使用它们,因为不可靠的响应可能会严重损害品牌声誉。此外,他补充说,它们还必须是安全的,以避免违反隐私法规的数据泄露。
在过去一年中,Couchbase 增强了 Capella 的功能,努力将其定位为 AI 开发人员的首选数据库。在 2024 年 2 月,它引入了向量搜索和检索增强生成功能,同时集成了 LlamaIndex 和 LangChain 等 AI 框架,以支持生成式 AI 应用程序的开发。然后在 9 月,该公司通过 Capella Columnar 进一步增强了 Capella 的 AI 功能,以支持开发更高级的生成式 AI 应用程序,这些应用程序可以分析实时数据以提供更个性化的体验。
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。