据Denodo公司称,其DeepQuery功能能让生成式AI超越检索增强生成(RAG)技术,后者只能检索事实。DeepQuery可以进行调查、综合分析并解释其推理过程。该公司表示,DeepQuery将允许用户提出诸如"是什么推动了各地区客户留存率的变化?"这样的问题,并通过连接不同系统中的实时、受治理数据,应用专家级推理,在几分钟内提供答案。
Denodo生产的数据管理平台产品能够虚拟化数据源,提供对关系数据库、云数据库、NoSQL数据库、OLAP数据库、SAP等企业应用、大数据、SaaS应用、流数据、非结构化数据、Excel文件、CSV数据等的实时访问。据称,DeepQuery利用这个中间件平台来回答多步骤分析问题。
我们采访了Denodo产品营销总监Kevin Bohan,以了解更多信息。
**标准生成式AI工具在数据分析方面的局限性**
Kevin Bohan表示:"标准生成式AI工具可以告诉你发生了什么,但在解释原因方面存在不足。这些工具通常通过总结从索引内容中收集的信息和数据来检索事实并回答直接问题,它们很少暴露出你可以完全信任的透明推理路径。它们缺乏发现趋势或模式背后驱动因素或根本原因的推理能力。这意味着当企业查询其数据时,他们只能获得无法自信采取行动的表面洞察。"
"标准生成式AI工具通常只能回答诸如'我们在东北地区的流失率是多少?'这样的问题,响应只是一个孤立的数字。DeepQuery更进一步,通过自然语言处理提供可解释的、推理驱动的分析能力。它允许用户提出复杂问题,如'为什么东北地区的流失率在增加,哪些因素——客户行为、服务响应时间或竞争活动——在起作用?'并快速收到可靠的响应。这提供了以前无法获得的竞争情报水平,并为更多员工开放了数据洞察。"
**什么是多步骤分析问题**
Kevin Bohan解释:"多步骤分析问题需要将复杂查询分解为较小部分,访问多个数据源并综合洞察来解释模式或根本原因。DeepQuery通过对实时、受治理数据进行推理来处理这些问题,提供传统生成式AI工具无法轻易产生的结构化答案。"
**索引内容应该被替换还是增强**
"索引内容应该被增强而不是替换。DeepQuery通过在实时、受治理源上应用结构化推理来构建现有索引数据。这产生了更丰富、可解释的洞察,而不会丢弃传统生成式AI的速度和实用性。"
**结构化推理的工作原理**
Kevin Bohan说:"结构化推理是将复杂问题分解为较小逻辑组件,同时分析多个来源的数据以创建可解释和逻辑洞察的过程。DeepQuery使用这种方法来回答诸如'上季度基金流出为何激增?'这样的问题。它不提供孤立的事实,而是提供透明的、多步骤的结论和引用。这帮助用户理解不仅发生了什么,还有为什么,从而实现更快、更自信的决策制定。它将不透明的'大语言模型猜测'转变为可审计和信任的可解释分析。"
DeepQuery在Denodo平台的语义层上运行,因此可以直接在实时企业系统上操作,无需复制或新管道。DeepQuery通过将复杂问题简化为可搜索组件、访问跨系统的实时受治理数据并通过逻辑和引用综合洞察来应用结构化推理。这允许实时进行可解释的跨功能分析,帮助用户理解不仅发生了什么,还有为什么——所有这些都无需创建数据副本。
**目标用户群体**
DeepQuery专为需要从复杂跨功能数据中获得快速、可解释洞察的业务用户、分析师和非技术团队而设计。其与行业无关的架构允许各行业用户用自然语言提出开放性问题,无需技术专业知识。这使数据分析对更广泛的受众更加可及,减少对数据专家的依赖,并赋予团队调查趋势根本原因的能力。
最大的好处是信心。DeepQuery为用户提供对复杂问题如"是什么推动了各地区客户留存变化?"的更快速、可解释、有证据支持的答案。这意味着团队可以从被动报告转向主动的、洞察驱动的决策制定。
据了解,DeepQuery通过REST API与OpenAI或Amazon Bedrock等第三方大语言模型服务集成以生成响应。DeepQuery接收用户的自然语言问题,使用由Denodo管理员设置的大语言模型进行解释。它使用其元数据目录将自然语言输入映射到相关的结构化数据源。DeepQuery将大语言模型解释查询的能力与其自己的查询优化引擎相结合,后者理解数据中的模式和关系。
大语言模型可以提供优化查询、处理歧义和推断问题中未明确说明的关系或上下文的能力。因此,如果用户说"显示上季度的销售趋势",大语言模型可以推断对时间序列数据和特定指标的需求,而Denodo将其映射到适当的数据字段。实际上,它将用户的自然语言查询转换为可以对底层数据源执行的结构化查询(如SQL)。Denodo检索结果,并将其发送回大语言模型进行自然语言响应生成,其中可以包括摘要和详细解释。
Q&A
Q1:DeepQuery与标准生成式AI工具有什么区别?
A:标准生成式AI工具只能告诉你发生了什么,通过检索事实回答直接问题。而DeepQuery能够进行推理驱动的分析,不仅回答"是什么",还能解释"为什么",提供透明的多步骤推理路径和可解释的洞察。
Q2:什么是多步骤分析问题?
A:多步骤分析问题是指需要将复杂查询分解为较小部分,访问多个数据源并综合洞察来解释模式或根本原因的问题。DeepQuery通过对实时、受治理数据进行推理来处理这些问题。
Q3:DeepQuery适合哪些用户使用?
A:DeepQuery专为业务用户、分析师和非技术团队设计,这些用户需要从复杂跨功能数据中获得快速、可解释的洞察。用户可以用自然语言提出开放性问题,无需技术专业知识,使数据分析更加便民。
好文章,需要你的鼓励
"影子AI"是指员工在未经公司批准的情况下使用AI工具办公。虽然ChatGPT等工具能提升效率,但将内部文件、客户数据或源代码输入未授权平台,可能导致企业数据失控。IBM报告显示,20%的企业存在未授权AI工具,63%尚无AI治理政策。专家建议,一味封禁效果有限,企业应明确哪些工具可用、哪些数据禁止上传,员工也应主动核查AI输出内容,避免将敏感信息粘贴至公共AI平台。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
Hirebotics联合Fanuc发布首款基于无代码Beacon平台的防爆协作喷涂机器人Cobot Painter。该方案适用于金属制造商,无需专用喷涂房或复杂编程,可在现有人工喷涂环境中数日内完成部署。操作人员通过平板或手机的"点击示教"功能即可引导机器人完成路径学习,实现液体涂料、粉末涂装等高精度重复作业,帮助制造商将涂装业务收回自主管理。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。