检索增强生成 (RAG) 已成为帮助企业利用企业数据优化大语言模型 (LLM) 输出的黄金标准。
虽然 LLM 通常使用公开信息进行训练,但 RAG 使企业能够利用产品、流程或政策等企业文档中的上下文或领域特定知识来增强其 LLM。
根据 McKinsey 的研究,RAG 在企业生成式 AI 服务中展现出的增强效果可以提升员工和客户满意度,从而改善整体性能。
然而,如何在企业范围内扩展 RAG 的应用并不明确,这本可以帮助组织加速其生成式 AI 用例的发展。早期为帮助快速开发新的基于 RAG 的生成式 AI 产品和服务而制定的可重复流程,遇到了影响性能和相关性的限制。
幸运的是,短期和中期解决方案为确保 RAG 在 2025 年及以后实现规模化提供了可能的路径。
RAGOps 的崛起
使用 RAG 的 LLM 需要访问高质量的训练数据。然而,由于数据分散在不同部门、系统和格式中,确保数据的质量和可用性往往具有挑战性。
为了最大限度地发挥效果,使用 RAG 的 LLM 还需要连接到部门希望提取数据的来源 - 如客户服务平台、内容管理系统和人力资源系统等。这种集成需要丰富的技术专业知识,包括数据映射和 API 管理经验。
此外,随着 RAG 模型的大规模部署,它们可能消耗大量计算资源并生成大量数据。这需要合适的基础设施和部署经验,以及管理大型组织中数据的能力。
RAGOps 是一种引起 AI 专家关注的主流化 RAG 方法,它是一种能够以确保一致性同时降低复杂性的方式自动化 RAG 工作流、模型和接口的方法。
RAGOps 使数据科学家和工程师能够自动化数据摄入和模型训练以及推理过程。它还通过提供基础设施堆栈中的负载均衡和分布式计算机制来解决可扩展性瓶颈。在 RAG 管道的每个阶段都执行监控和分析,以帮助持续优化和改进模型和操作。
例如,McKinsey 使用 RAGOps 帮助其 Lilli 生成式 AI 平台筛选 100,000 份精选文档。Lilli 已回答了超过 800 万个提示,约四分之三的 McKinsey 员工使用它来搜索有关运营的定制见解。
智能代理 RAG 的时代即将到来
作为组织寻求从生成式 AI 实施中获取更多价值的运营模型,RAGOps 有望在已经实践其他运营框架(如 DevOps 或 MLOps)的组织中得到良好应用。
然而,一些组织可能采用更新颖的方法,即跟随生成式 AI 行业的发展方向:将 RAG 与智能代理 AI 结合,使 LLM 能够适应不断变化的上下文和业务需求。
根据 Deloitte 的研究,到 2025 年,25% 的组织将实施企业代理,到 2027 年将增长到 50%。这些旨在以最少人工干预执行数字任务的代理正引起希望将更多数字运营委托给软件的企业的兴趣。
具有 RAG 功能的智能代理 AI 将包括许多方法和解决方案,但许多场景可能会共享一些共同特征。
例如,个别代理将评估和总结来自单个文档的提示答案,甚至比较多个文档之间的答案。元代理将协调这个过程,管理个别代理并整合输出以提供连贯的响应。
最终,代理将在 RAG 框架内进行多步骤的分析、规划和推理,在执行任务时学习并根据新输入调整策略。这将帮助 LLM 随着时间的推移更好地响应更细微的提示。
至少在理论上是这样。
结论
生成式 AI 技术的未来一片光明,它将从研究实验室流向企业 AI 工厂,成为蓬勃发展的企业 AI 领域的一部分。
例如,模型的占用空间将缩小,同时变得更加优化,以便在本地和边缘的 AI PC 及其他设备上高效运行。RAG 标准化,包括软件库和现成工具,将不断发展。
无论您的组织是采用 RAGOps 还是采用智能代理 AI,都有解决方案正在出现,帮助组织扩展 RAG 实施。
以医疗保健为例,在 Dell AI Factory 和 NVIDIA 上应用的智能代理 RAG,有助于协调利用结构化数据(如患者日程和档案)以及非结构化数据(如医疗记录和影像文件)的挑战,同时保持对 HIPAA 和其他要求的合规性。
这只是众多光明选择中的一个。更多解决方案正在涌现,为正在进行生成式 AI 之旅的组织照亮前进的道路。
好文章,需要你的鼓励
Google 推出最新的 Gemini 2.5 Pro (实验版) AI 模型,并以罕见的速度向免费用户开放。该模型支持模拟推理,提高了准确性,并在 LMSYS 聊天机器人竞技场排行榜上名列前茅。免费用户可在网页上试用,但有使用限制,无法上传文件,且有未明确的token和使用次数限制。
Gartner 预测,大语言模型 (LLM) 提供商市场即将进入"灭绝"阶段。在竞争激烈的环境下,巨额资本投入成为主要挑战。预计到 2025 年,全球生成式 AI 支出将达到 6440 亿美元,较 2024 年增长 76%。专家认为,LLM 市场将经历类似云计算市场的整合,最终可能只剩少数几家主导者。
苹果公司推出新一代 AI 智能服务 Apple Intelligence,包括优先通知等多项功能。该服务现已覆盖欧盟用户和 Vision Pro 设备,并支持多种语言。新功能随 iOS 18.4 等系统更新推出,涵盖通知管理、图像生成和视频创作等方面,进一步提升用户体验。
OpenAI计划今年晚些时候向开发者社区发布一个"开放权重"模型,这是该公司自2019年以来的首次尝试。新模型将具备推理能力,类似于现有的o3-mini模型。这一战略转变旨在应对来自竞争对手的压力,同时为开发者提供更多定制和使用灵活性。虽然不完全开源,但这种方式可能有助于OpenAI在保持技术领先的同时,满足市场对更开放AI发展的需求。