数据库公司 Couchbase Inc. 通过与 Nvidia Corp. 的 NIM 微服务集成,增强了其人工智能代理构建工具 Capella AI Model Services 的功能。
此次更新将使 Couchbase Capella 数据库用户更容易创建所谓的主动式 AI 应用程序。这类应用程序超越了传统聊天机器人的能力,能够以最少的监督代表用户执行任务。
Couchbase 在去年 12 月推出 Capella AI Services 时引入了 Capella AI Model Services,表示这些服务可以帮助简化 AI 代理的开发。它们还提供了在支持这些 AI 代理的大语言模型中创建和嵌入托管端点的工具,确保它们能够满足组织的性能、延迟和隐私要求。
Couchbase Capella 是开源 Couchbase NoSQL 数据库的云版本。与 Oracle 等传统数据库相比,其主要优势在于能够处理结构化和非结构化信息,这使其成为需要访问这两种类型数据的 AI 应用程序的理想选择。它还可以作为数据缓存。
借助 NIM 实现高性能 AI 代理
NIM (Nvidia Inference Microservices) 将优化的推理引擎、行业标准应用程序编程接口和预测试的大语言模型打包到软件容器中,便于部署。其他打包工具包括 Nvidia 的 NeMo Guardrails,有助于实施策略并防止 AI 产生幻觉。此外,它还允许组织引入自己的专有数据来实现检索增强生成,并增强其大语言模型的知识。
通过将 Capella AI Model Services 与 NIM 集成,Couchbase 表示客户可以让他们的 AI 代理更接近底层数据和支持它们的图形处理单元。这意味着他们可以构建具有更高吞吐量和更大模型灵活性的 AI 应用程序。
Couchbase 产品和合作伙伴高级副总裁 Matt McDonough 表示,AI 代理需要一个统一且高性能的数据平台,以支持应用程序开发生命周期的每个步骤。
"我们为客户提供了以安全和受控方式运行其首选 AI 模型的灵活性,同时为 AI 工作负载提供更好的性能,并实现 AI 与事务性和分析性数据的无缝集成,"他解释道。
McDonough 表示,这是必要的,因为企业在 AI 代理的可靠性和合规性方面经常面临挑战。他说,让 AI 代理正确运行很重要,特别是如果要在面向客户的应用程序中使用它们,因为不可靠的响应可能会严重损害品牌声誉。此外,他补充说,它们还必须是安全的,以避免违反隐私法规的数据泄露。
在过去一年中,Couchbase 增强了 Capella 的功能,努力将其定位为 AI 开发人员的首选数据库。在 2024 年 2 月,它引入了向量搜索和检索增强生成功能,同时集成了 LlamaIndex 和 LangChain 等 AI 框架,以支持生成式 AI 应用程序的开发。然后在 9 月,该公司通过 Capella Columnar 进一步增强了 Capella 的 AI 功能,以支持开发更高级的生成式 AI 应用程序,这些应用程序可以分析实时数据以提供更个性化的体验。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。