从RAG到本体论:企业AI的下一个前沿
向量数据库、检索增强生成(RAG)之后,企业AI的下一个前沿正在成形:为自主智能体提供对业务共同理解的上下文层。Databricks正通过Genie Ontology推进这一愿景。
目前处于预览阶段的Genie Ontology,能够自动从企业数据、仪表板、查询、数据管道、文档和应用程序中提取业务上下文,并将其整理成一个动态知识图谱,供AI智能体理解组织的运作方式。
该功能在Databricks Data + AI峰会上正式亮相。Genie Ontology采用了受谷歌PageRank启发的排名机制,用以识别组织内最具权威性的业务定义。
Databricks首席执行官Ali Ghodsi在主题演讲中表示,这套系统并非等同看待所有信息来源,而是综合评估创建者身份、使用广泛程度、与认证数据集的关联程度,以及更新时效等因素,从而判断AI智能体应当采信哪个答案。他同时补充说,企业还可以通过Databricks现有的Unity Catalog Semantics平台,将自有业务定义或本体论上传至Genie Ontology。
统一上下文层的价值与局限
分析师认为,对于CIO而言,以Genie Ontology为代表的统一上下文层,将切实提升企业AI部署的一致性、可信度与治理水平。
Moor Insights and Strategy首席分析师Michael Leone表示:"一套定义驱动所有智能体运行,意味着同一个问题不会再得到三种不同的答案。RAG和向量搜索这类旧方法,只是返回与问题相似的内容,并不真正理解业务。而本体论赋予了智能体目录所无法提供的语义——明确术语含义,以及应该信任哪个数据源。"
HFS Research执行研究负责人Ashish Chaturvedi认为,一致性的提升同样有助于缓解信任危机——这仍是企业AI落地的最大障碍之一。他指出:"企业AI采用的最大障碍,在于决策者对AI输出结果的信任度不足,不敢不加核实就付诸行动。将答案锚定于受治理业务定义、并可追溯至数据源的本体论,能够直接攻克这一信任赤字。"
然而,Leone对信任层面的论点持更为审慎的态度:"这是个有前景的想法,但在我将其用于重要决策之前,它还需要经过实践检验。"
HyperFRAME Research AI技术栈实践负责人Stephanie Walter也指出,本体论存在一个关键缺失环节——验证机制:"本体论可以改善上下文,但无法保证答案的正确性。智能体仍可能提取不完整的数据、应用错误逻辑、遗漏数据行、误解工作流,或采取错误行动。"
Leone进一步指出,这一验证缺口之所以更加关键,在于大多数企业目前尚不具备为AI部署实施本体论层所需的数据和治理成熟度:"如果你的数据和治理体系本身就不完善,这只会加速既有混乱的蔓延。"
Walter同样强调,本体论无法凭一己之力解决定义混乱、数据溯源不清、权属薄弱或权限分散等问题,并指出CIO面临的真正难点不在于一次性构建本体论,而在于随着业务变化持续保持其准确性:"企业需要明确的数据所有权、指标所有权、领域专业知识、治理流程,以及解决定义冲突的机制。否则,本体论只会沦为另一个徒有精美名称的过时元数据项目。"
供应商竞争加剧,CIO面临选择困境
在数据与治理就绪度挑战之外,随着多家技术厂商相继推出类似Genie Ontology的企业AI业务上下文锚定方案,CIO还面临日益突出的认知混乱风险。Leone指出,过去一年间,Snowflake、微软等公司相继推出了某种形式的本体论、语义或上下文层产品,问题就出在这些产品的命名方式上:"所有人都给本质上相同的理念贴上了不同标签,造成了混乱,拖慢了企业的决策节奏。"
IT咨询公司Kanerika联合创始人兼首席营收官Bhupendra Chopra认为,这种混乱也可能反噬Databricks等供应商:"尽管营销口径都已聚焦于上下文构建,但大多数企业最终会选择自身数据已经所在的平台。"
Chaturvedi对此表示认同,并建议CIO避免孤立地评估本体论产品,坚守"上下文层跟随数据引力"的原则:"数据在Databricks,就走Genie Ontology;在Snowflake,就用Horizon Context;如果是微软生态,就选IQ系列。"他同时呼吁CIO超越功能层面,评估这些产品的开放性与可移植性,尤其是在业务定义可能需要跨数据湖仓、分析工具和AI平台流转的多平台环境中。
Chaturvedi认为,Snowflake正以开放语义互操作性为核心差异化方向,致力于降低企业在演进数据与分析技术栈过程中陷入语义锁定的风险,从而与竞争对手拉开距离。
争夺企业AI控制平面
分析师指出,Snowflake的差异化努力,至少对CIO而言,将外界目光引向了一场更大规模的竞争——包括Databricks在内的各家供应商,都在争夺企业AI控制平面的主导地位。
Chaturvedi介绍称,Snowflake正试图通过Snowflake Intelligence、Horizon Catalog以及开放语义互操作性的推进,将自身定位为AI控制层;微软则通过Work IQ、Fabric IQ和Foundry IQ等产品,将业务上下文与治理能力嵌入Copilot、Fabric及更广泛的AI技术栈之中。他同时指出,Databricks的Genie Ontology同样服务于类似战略,并建议CIO将其置于公司更宏观的布局中加以理解——Databricks正致力于将其湖仓平台打造为企业AI智能体构建、治理与部署的基础设施。
"这毫无疑问是一场控制平面之争。将Databricks在本次峰会上发布的所有内容串联起来——包括LTAP、OpenSharing和Genie Ontology——你会看到一个单一的汇聚点,企业数据、治理、业务语义与智能体执行在此合而为一。"Chaturvedi表示。
他进一步指出,这一控制平面战略折射出Ghodsi更宏观的愿景:数据平台有望演进为他所描述的"智能体系统级记录"——一个AI智能体赖以读取数据、推理分析并采取行动的权威来源。Chaturvedi将这一概念与早期的平台范式迁移相类比:ERP系统曾成为业务交易的系统级记录,数据仓库曾成为分析的系统级记录,而下一场争夺,正是围绕谁能成为企业AI智能体的系统级记录而展开。
Leone也认同数据平台在这场竞争中具备先天优势,因为它们已经掌握了智能体安全运行所需的数据、治理控制、数据溯源和权限体系。
尽管如此,分析师们也提醒道,上下文层并非决定最终胜负的唯一要素。Walter一语道破:"企业AI的下一个战场,不只是上下文,而是可验证的执行能力。"
Q&A
Q1:Genie Ontology是什么?它能解决什么问题?
A:Genie Ontology是Databricks推出的业务上下文层产品,目前处于预览阶段。它能够自动从企业数据、仪表板、查询、数据管道、文档和应用程序中提取业务上下文,并整理成动态知识图谱,供AI智能体理解组织运作方式。其核心价值在于为所有智能体提供统一的业务定义,避免同一问题得到不同答案,从而提升企业AI部署的一致性与可信度。
Q2:Genie Ontology与RAG有什么区别?
A:RAG和向量搜索只是返回与问题相似的内容,并不真正理解业务含义。Genie Ontology则通过本体论赋予AI智能体真正的语义理解能力,明确业务术语的含义,并通过类似谷歌PageRank的排名机制判断哪个数据源最具权威性。简单来说,RAG是"找相似",而本体论是"懂含义",后者更适合需要精准业务理解的企业AI应用场景。
Q3:企业在引入Genie Ontology时需要注意哪些风险?
A:分析师指出了几个主要风险:一是验证缺口,本体论能改善上下文但无法保证答案正确,智能体仍可能犯错;二是数据和治理成熟度不足,若企业数据治理本身存在问题,本体论只会加速混乱;三是持续维护难度大,企业需要明确的数据所有权、治理流程和冲突解决机制,否则本体论会沦为过时的元数据项目。
好文章,需要你的鼓励
今天讲的出海案例是依米康,这家数据中心温控与液冷设备厂商正在把泰国纳入海外交付体系,并用生产线、总装车间和焓差实验室承接算力设施订单。
BioMatrix是首个将分子序列、分子三维结构、蛋白质序列、蛋白质三维结构和自然语言统一在单一语言模型中的生物基础模型,在80项任务中77项达到最优或第二优。
Salesforce正式推出Help Agent,这是基于Agentforce平台的预封装AI客服智能体,可在数分钟内连接企业知识库、操作功能及网页、短信、语音等沟通渠道。该产品同步推出按解决率计费模式,每次成功自主解决客户问题收费2美元,无需按token或操作次数计费。Help Agent支持低代码构建,内置测试功能,并配备全新客户服务门户。该产品预计于2026年7月正式上线。
浙江大学提出SKILLHARNESS框架,通过为AI电脑助手的每项技能附加安全边界,从成功、失败和风险三类经历中学习,使AI在动态危险环境中安全高效地完成任务。