检索增强生成（RAG）为何在今天如此流行？

检索增强生成（RAG）正成为AI领域的关键技术，通过结合外部信息检索与大语言模型的生成能力，解决传统模型仅依赖训练数据的局限性。RAG允许模型实时访问外部数据库或文档，提供更准确、更新的信息。该技术可应用于企业文档查询、个人化AI助手等场景，通过向模型提供特定领域知识来获得精准结果。微软专家指出，RAG有助于结合知识与推理、提高模型使用效率，并支持多模态应用。

在人工智能领域，有一种名为检索增强生成（RAG）的方法正在成为帮助模型获得精准结果的关键途径。

你可以说这就像巧克力和花生酱一样——两种美味的食物搭配在一起会更加美味。

或者你也可以用更技术性的方式来描述它。本质上，检索增强生成是指在大语言模型应用其自身训练数据和知识来完成任务时，为其添加应该了解的额外信息。

GeeksforGeeks的专家是这样解释的：

"在传统的大语言模型中，模型仅基于其训练数据生成回复，这些数据可能不包含最新信息或特定任务所需的具体细节。RAG通过整合检索机制来解决这一局限性，允许模型实时访问外部数据库或文档。"

然后他们提供了一个包含"数据块"和其他组件的流程图，展示了这种方法的工作原理。

考虑一下这在实践中是如何工作的——例如，你可以给聊天机器人提供一系列关于你业务的白皮书，然后询问有关你商业模式的问题。或者在个人层面，如果你希望AI更好地理解你，你可以向它提供个人文档，如日记记录或你过去的文章，以帮助它更好地了解你这个人。

从广义上说，你可以认为RAG涉及添加任何不在原始训练集中的内容。这可能是出于细节、时效性或用途的考虑，或者仅仅是为了帮助按你希望的方式定向结果。

直击要点

我很喜欢这个观点——

在Learn By Building AI网站上，比尔·钱伯斯（Bill Chambers）解释说RAG有一种简单的方法。

首先，他将其与他在Facebook发现的这段描述进行对比：

"构建一个能够研究和情境化的模型更具挑战性，但这对未来的进步至关重要。我们最近在检索增强生成（RAG）架构方面取得了重大进展，这是一个端到端可微分模型，结合了信息检索组件（Facebook AI的密集段落检索系统）和序列到序列生成器（我们的双向自回归Transformer[BART]模型）。RAG可以在知识密集型下游任务上进行微调，与最大的预训练序列到序列语言模型相比，能够达到最先进的结果。与这些预训练模型不同，RAG的内部知识可以轻松更改甚至即时补充，使研究人员和工程师能够控制RAG知道什么、不知道什么，而无需浪费时间或计算能力重新训练整个模型。"

天哪...

然后钱伯斯提供了一个简洁的小图，显示"文档语料库"通过用户输入连接到大语言模型。

这对我来说很有意义：RAG意味着添加特定的信息资源！当然，有技术细节，但我认为这个教程在分解这个概念方面做得很好，所以这是任何想要了解更多关于它实际工作原理的人的另一个资源。

使用RAG

我还想参考微软AI项目高级总监索达拉拉詹·斯里尼瓦桑（Soundararajan Srinivasan）和他的同事、微软高级应用科学家瑞什米·戈什（Reshmi Ghosh）在四月份"想象付诸行动"活动上的技术演讲，他们讨论了RAG的实际应用。

使用"知识存储"、"向量数据库"、"编排器"和"元提示"等术语，斯里尼瓦桑介绍了这些系统如何工作，说它们帮助我们在上下文中理解AI的局限性。

"上下文"也是一个重要术语，因为正如他所描述的，更大的上下文窗口增加了能力，可能具有更低的内存占用。

演讲者谈到使用RAG的其他一些原因包括：

结合知识和推理

民主化模型使用

提高时间资源效率

戈什随后谈到了我们如何理解模型是否选择在其处理中使用RAG信息。

"你有所有这些不同的上下文与查询一起发送，告诉模型'嘿，这是你可能知道也可能不知道的外部知识'，"她说。

"当我们使用大语言模型以及像llama和phi这样的小语言模型设计系统时，我们基本上发现，如果你可以通过分割数据点而不是微调来发送上下文，你仍然会以准确的定性方式获得事实查询的答案。"

戈什还提到了多模态性。

"你基本上可以拥有包含图像、语音笔记、声音或任何类型音乐笔记的数据库，你仍然可以围绕它构建AI应用程序并获得同样的收益，因为现在你知道模型倾向于利用RAG上下文并减少对内部记忆的依赖，这也为正在讨论的所有新框架打开了新的大门。"

她补充说，这对于MCP（模型上下文协议）和A2A（智能体到智能体系统）等协议很有用。

这在我们进入新界面时代时很重要，我们不再仅限于与AI伙伴打字交流。我们现在有了语音，未来还会有更多，包括足够生动的图像和视频生成，可以取代基于文本的模型。

有些人会说我们正在进入一个梦想的世界，在这里很多以前不可能的事情现在都成为可能。

RAG可能是确保我们能够掌控方向并提供我们所寻求的结果类型的组件之一。它有助于你可能归类为数字智能系统"融合"的东西。因此，在我们继续设计更复杂的AI工具和资源时，请关注这些方法论。

来源：Forbes

0赞

好文章，需要你的鼓励

检索增强生成（RAG）为何在今天如此流行？

来源：Forbes

2025

07/10

09:09

分享

点赞

数智时代，openGauss Summit 2025即将发布哪些技术创新破局

“算力+储能”深度融合：超智算发布分布式算力超级节点储能解决方案

联想推出DE6600系列：更智能的存储解决方案

创业公司如何在严格监管行业中实现生死攸关的创新

OpenAI发布GPT-5.2-Codex模型，软件工程自动化能力大幅提升

Waterfox浏览器宣布拒绝AI功能，瞄准Firefox忠实用户

TikTok美国业务出售交易将于下月完成

破局AI数据中心安全瓶颈：Fortinet联合NVIDIA引领隔离式加速新航向

智算中心进化论，科华数据如何做到“更懂”

更高负载、更快建设：2026年数据中心六大趋势

Snowflake数据库更新引发全球大规模服务中断

AI编程初创公司Lovable融资3.3亿美元，英伟达等科技巨头支持

iMerit公司：高质量数据而非数据量是AI未来发展关键

Anubis守护网站抵御大语言模型爬虫攻击

IBM watsonx平台推出v2.2版本，全面增强AI智能体开发能力

CIO将运用AI和低代码技术应对SaaS应用泛滥

BigQuery如何结合数据与AI实现企业转型

中国研究人员发布MemOS，首个让AI拥有人类般记忆的"内存操作系统"

MCP难以满足合规要求：受监管行业对开放智能体交换持谨慎态度

IBM推出基于定制Power11处理器的新服务器系列

超七成家长称学校未教授编程课程

新型AI模型的深度研究功能及其应用探索

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: