对于许多开发者来说,构建 AI 应用的难点已经不再是模型本身,而是如何让应用的知识库保持实时更新。
检索增强生成(RAG)技术已成为将 AI 应用与企业数据相结合的主流方案,但它也带来了持续的运维工作,包括更新嵌入向量和索引、同步数据源以及调优检索性能等。
AWS 正在通过推出 Bedrock 托管知识库(Bedrock Managed Knowledge Base)来解决上述痛点。这是一项新的托管服务,旨在自动化企业 AI 应用背后的检索层。
AWS 高级解决方案架构师 Daniel Abib 在一篇博文中写道:"默认情况下,该服务会自动为您选择并管理默认的嵌入模型、重排序模型和基础模型,让您无需自行选择或维护,即可快速上手。"
为了帮助企业维护数据管道,同时省去构建和管理自定义集成的麻烦,该服务还内置了六个企业数据源的原生连接器,涵盖 Amazon S3、SharePoint、Confluence、Google Drive、OneDrive 以及网页内容。
Pareekh Consulting 首席分析师 Pareekh Jain 表示,对于开发团队而言,自动化基础设施管理的能力能够立竿见影地提升生产效率。"企业往往需要花费大量时间构建数据连接器、管理文档的摄取与索引、调优检索质量、落实访问控制以及维护向量数据库,这使得 RAG 基础设施的复杂程度甚至超过了 AI 应用本身。有了这项服务,开发者就可以专注于应用构建本身了。"
Jain 补充道:"这将有助于缩短部署周期、降低维护成本,同时让团队能够将精力集中在业务价值的实现上。"
除了降低基础设施管理负担,Bedrock 托管知识库还致力于提升检索准确性。Abib 介绍,该服务配备了智能解析(Smart Parsing)和智能体检索器(Agentic Retriever)等功能,旨在提升不同内容类型和数据源的检索准确度。这一问题在 RAG 管道中普遍存在,尤其体现在跨多个数据仓库的查询场景中。
Jain 认为,检索质量的提升对于希望将 AI 项目从实验阶段推向生产环境的企业尤为关键。"这是企业普遍面临的挑战,因为业务数据分散在多个系统中。随着组织将 AI 从试点推进到生产阶段,检索质量对用户信任至关重要,而 RAG 基础设施也因此成为拖慢部署进度的主要瓶颈。"
AWS 还将 Bedrock 托管知识库定位为智能体应用的核心构建模块。Jain 指出,智能体应用对企业知识库和检索系统的要求更高。据 AWS 介绍,该服务与 Bedrock AgentCore 深度集成,大幅减少了将企业知识源接入 AI 智能体所需的代码量和配置工作,同时提供内置的监控、评估和访问管理能力。
Jain 认为,这种集成化方案还将对更广泛的 RAG 工具生态产生影响。"Bedrock 托管知识库这类托管服务,可能会削弱独立 RAG 编排与检索框架的市场需求,包括 LangChain、LlamaIndex 等工具,以及一些由向量数据库、数据摄取管道和检索服务自定义组合而成的解决方案。"
不过,Jain 也提示,集成化方案的便利性伴随着一定的取舍,可能会加深用户对单一云服务商的依赖,并限制在 AI 基础设施搭建与管理方式上的灵活性。
Amazon Bedrock 托管知识库目前已在北弗吉尼亚、俄勒冈、悉尼、东京、都柏林、法兰克福、伦敦以及 AWS GovCloud(美国西部)等区域正式上线。
该服务采用按使用量计费的定价模式,费用与存储的索引数据量及处理的检索请求数量挂钩。
Q&A
Q1:Bedrock 托管知识库是什么?它解决了什么问题?
A:Bedrock 托管知识库是 AWS 推出的一项托管服务,主要解决企业在使用 RAG 技术时面临的高运维负担问题。传统 RAG 方案需要开发者手动管理嵌入模型、向量数据库、数据同步等工作,而该服务可自动选择和管理模型,并内置六个企业数据源连接器,让开发者无需处理底层基础设施,专注于应用本身的开发。
Q2:Bedrock 托管知识库支持哪些数据源?
A:该服务目前内置了六个原生连接器,支持的数据源包括 Amazon S3、SharePoint、Confluence、Google Drive、OneDrive 以及网页内容。这些连接器可帮助企业维护数据管道,无需自行构建和管理自定义集成方案。
Q3:使用 Bedrock 托管知识库会不会造成云厂商锁定?
A:存在一定风险。分析师 Pareekh Jain 指出,这类集成化托管服务在提升便利性的同时,可能增加用户对 AWS 单一云服务商的依赖,并在一定程度上限制企业在 AI 基础设施选型和管理方式上的灵活性。企业在采用前需权衡便利性与可迁移性之间的取舍。
好文章,需要你的鼓励
今天讲的出海案例是依米康,这家数据中心温控与液冷设备厂商正在把泰国纳入海外交付体系,并用生产线、总装车间和焓差实验室承接算力设施订单。
BioMatrix是首个将分子序列、分子三维结构、蛋白质序列、蛋白质三维结构和自然语言统一在单一语言模型中的生物基础模型,在80项任务中77项达到最优或第二优。
美国远程医疗巨头Hims & Hers完成对澳大利亚竞争对手Eucalyptus的收购后,正式进军英国、德国、日本等市场。公司肥胖症业务负责人Craig Primack博士表示,肥胖症是慢性、复发性疾病,需综合治疗方案而非单纯开药。远程医疗能填补NHS等公共医疗体系的服务缺口,为患者提供药物、营养、运动及生活方式的全方位支持,并在GP停诊时提供及时的医疗咨询。
浙江大学提出SKILLHARNESS框架,通过为AI电脑助手的每项技能附加安全边界,从成功、失败和风险三类经历中学习,使AI在动态危险环境中安全高效地完成任务。