据Denodo公司称,其DeepQuery功能能让生成式AI超越检索增强生成(RAG)技术,后者只能检索事实。DeepQuery可以进行调查、综合分析并解释其推理过程。该公司表示,DeepQuery将允许用户提出诸如"是什么推动了各地区客户留存率的变化?"这样的问题,并通过连接不同系统中的实时、受治理数据,应用专家级推理,在几分钟内提供答案。
Denodo生产的数据管理平台产品能够虚拟化数据源,提供对关系数据库、云数据库、NoSQL数据库、OLAP数据库、SAP等企业应用、大数据、SaaS应用、流数据、非结构化数据、Excel文件、CSV数据等的实时访问。据称,DeepQuery利用这个中间件平台来回答多步骤分析问题。
我们采访了Denodo产品营销总监Kevin Bohan,以了解更多信息。
**标准生成式AI工具在数据分析方面的局限性**
Kevin Bohan表示:"标准生成式AI工具可以告诉你发生了什么,但在解释原因方面存在不足。这些工具通常通过总结从索引内容中收集的信息和数据来检索事实并回答直接问题,它们很少暴露出你可以完全信任的透明推理路径。它们缺乏发现趋势或模式背后驱动因素或根本原因的推理能力。这意味着当企业查询其数据时,他们只能获得无法自信采取行动的表面洞察。"
"标准生成式AI工具通常只能回答诸如'我们在东北地区的流失率是多少?'这样的问题,响应只是一个孤立的数字。DeepQuery更进一步,通过自然语言处理提供可解释的、推理驱动的分析能力。它允许用户提出复杂问题,如'为什么东北地区的流失率在增加,哪些因素——客户行为、服务响应时间或竞争活动——在起作用?'并快速收到可靠的响应。这提供了以前无法获得的竞争情报水平,并为更多员工开放了数据洞察。"
**什么是多步骤分析问题**
Kevin Bohan解释:"多步骤分析问题需要将复杂查询分解为较小部分,访问多个数据源并综合洞察来解释模式或根本原因。DeepQuery通过对实时、受治理数据进行推理来处理这些问题,提供传统生成式AI工具无法轻易产生的结构化答案。"
**索引内容应该被替换还是增强**
"索引内容应该被增强而不是替换。DeepQuery通过在实时、受治理源上应用结构化推理来构建现有索引数据。这产生了更丰富、可解释的洞察,而不会丢弃传统生成式AI的速度和实用性。"
**结构化推理的工作原理**
Kevin Bohan说:"结构化推理是将复杂问题分解为较小逻辑组件,同时分析多个来源的数据以创建可解释和逻辑洞察的过程。DeepQuery使用这种方法来回答诸如'上季度基金流出为何激增?'这样的问题。它不提供孤立的事实,而是提供透明的、多步骤的结论和引用。这帮助用户理解不仅发生了什么,还有为什么,从而实现更快、更自信的决策制定。它将不透明的'大语言模型猜测'转变为可审计和信任的可解释分析。"
DeepQuery在Denodo平台的语义层上运行,因此可以直接在实时企业系统上操作,无需复制或新管道。DeepQuery通过将复杂问题简化为可搜索组件、访问跨系统的实时受治理数据并通过逻辑和引用综合洞察来应用结构化推理。这允许实时进行可解释的跨功能分析,帮助用户理解不仅发生了什么,还有为什么——所有这些都无需创建数据副本。
**目标用户群体**
DeepQuery专为需要从复杂跨功能数据中获得快速、可解释洞察的业务用户、分析师和非技术团队而设计。其与行业无关的架构允许各行业用户用自然语言提出开放性问题,无需技术专业知识。这使数据分析对更广泛的受众更加可及,减少对数据专家的依赖,并赋予团队调查趋势根本原因的能力。
最大的好处是信心。DeepQuery为用户提供对复杂问题如"是什么推动了各地区客户留存变化?"的更快速、可解释、有证据支持的答案。这意味着团队可以从被动报告转向主动的、洞察驱动的决策制定。
据了解,DeepQuery通过REST API与OpenAI或Amazon Bedrock等第三方大语言模型服务集成以生成响应。DeepQuery接收用户的自然语言问题,使用由Denodo管理员设置的大语言模型进行解释。它使用其元数据目录将自然语言输入映射到相关的结构化数据源。DeepQuery将大语言模型解释查询的能力与其自己的查询优化引擎相结合,后者理解数据中的模式和关系。
大语言模型可以提供优化查询、处理歧义和推断问题中未明确说明的关系或上下文的能力。因此,如果用户说"显示上季度的销售趋势",大语言模型可以推断对时间序列数据和特定指标的需求,而Denodo将其映射到适当的数据字段。实际上,它将用户的自然语言查询转换为可以对底层数据源执行的结构化查询(如SQL)。Denodo检索结果,并将其发送回大语言模型进行自然语言响应生成,其中可以包括摘要和详细解释。
Q&A
Q1:DeepQuery与标准生成式AI工具有什么区别?
A:标准生成式AI工具只能告诉你发生了什么,通过检索事实回答直接问题。而DeepQuery能够进行推理驱动的分析,不仅回答"是什么",还能解释"为什么",提供透明的多步骤推理路径和可解释的洞察。
Q2:什么是多步骤分析问题?
A:多步骤分析问题是指需要将复杂查询分解为较小部分,访问多个数据源并综合洞察来解释模式或根本原因的问题。DeepQuery通过对实时、受治理数据进行推理来处理这些问题。
Q3:DeepQuery适合哪些用户使用?
A:DeepQuery专为业务用户、分析师和非技术团队设计,这些用户需要从复杂跨功能数据中获得快速、可解释的洞察。用户可以用自然语言提出开放性问题,无需技术专业知识,使数据分析更加便民。
好文章,需要你的鼓励
Meta宣布为Facebook Dating推出AI聊天机器人助手,帮助用户找到更匹配的对象。该AI可根据用户需求推荐特定类型的匹配者,并协助优化个人资料。同时推出Meet Cute功能,每周提供算法选择的"惊喜匹配"。尽管18-29岁用户匹配数同比增长10%,但相比Tinder的5000万日活用户仍有差距。AI功能已成为约会应用标配,Match Group等竞争对手也在大力投资AI技术。
字节跳动团队提出RewardDance框架,首次系统性解决视觉生成中的奖励模型扩展问题。该框架通过将奖励预测转为生成式任务,并将模型规模扩展至260亿参数,同时集成任务指令、参考样例和推理能力,有效解决了"奖励作弊"问题。实验显示,在文本生成图像任务中质量提升10.7分,视频生成性能改善49%,达到行业领先水平,为AI视觉创作提供了更强大可靠的技术基础。
Neo4j认为已找到让生成式AI访问图数据库记录的方法。图数据库专注于数据点之间的关系建模和查询,在欺诈检测、推荐引擎等场景中表现出色。2024年4月,ISO批准了图查询语言GQL标准,Neo4j的Cypher查询语言完全符合该标准。现代工具提供拖拽式工作流程,GenAI可作为自然语言接口,将用户请求转换为Cypher查询。
ByteDance团队开发的Mini-o3系统通过深度多轮推理突破了传统AI视觉理解的局限。该系统能像人类侦探般进行几十轮的视觉探索,在困难的视觉搜索任务上准确率达48%,相比现有模型提升显著。核心创新包括挑战性的Visual Probe数据集、多样化推理策略训练和突破性的过轮掩码技术,实现了测试时思考轮数的自然扩展。