Google Cloud推出了一款新工具QueryData,旨在提升多智能体系统或应用中,AI智能体查询数据库时的准确性。
QueryData能够将自然语言转化为数据库查询语句,Google声称其准确率"接近100%"。该工具被定位为大语言模型直接生成查询语句的替代方案。Google指出,大语言模型由于对数据库结构理解有限,且依赖概率推理,在直接生成查询时容易产生不准确的结果。
不过,要建立这种必要的数据理解能力,使用QueryData的企业团队首先需要定义Google所称的"上下文",即描述数据应如何被访问和查询的相关信息。这一过程涉及对数据库结构的详细编码,包括表格说明、数据关系、业务含义,以及指导查询生成或执行方式的确定性指令。
一旦上下文和规则配置完成,团队便可使用"上下文工程助手"(Context Engineering Assistant)——这是Gemini CLI中的一个专属智能体,可基于Evalbench评估框架对查询准确性进行迭代审查,直至达到满意效果。
完成上述配置后,QueryData可集成到智能体驱动的工作流中,作为用户请求与底层数据库之间的执行层。
QueryData既可在Google Cloud自有的数据智能体中使用(目前已在BigQuery中上线),也可通过API由企业自行调用,用于构建自定义智能体和多智能体系统。目前该工具支持AlloyDB、CloudSQL for MySQL、CloudSQL for PostgreSQL及Spanner。
Google在一篇博客文章中解释道:在自定义配置中,智能体负责推理与编排,而QueryData则负责针对数据源生成、验证和执行查询,并将结果返回,供后续操作或决策使用。
Pareekh Consulting首席分析师Pareekh Jain认为,这一新工具标志着AI从工具型向内置护栏的结果导向型智能体转变,有助于企业将多智能体系统和应用推向生产环境,并在金融、运营和供应链等部门实现"决策级应用场景"。
然而,他也提出了警示:尽管QueryData降低了开发人员在提示工程方面的工作量,并提升了运行时的可靠性,但这实际上将工作重心转移到了前期设计和持续维护上。
"它要求对数据库结构有清晰的理解,需要针对每个数据源编写确定性指令,并随着结构的演变持续维护,"他指出,"这实际上为智能体创造了一个全新的工作类别——数据访问工程。"
他表示:"这种权衡非常明显。不用QueryData,系统构建更快但生产环境中不够可靠;使用QueryData,构建周期更长,但在大规模场景下具备可行性。"
Jain认为,这种权衡最终将影响企业的使用模式——在受监管和关键任务环境中,采用率可能最高;而在轻量级或实验性场景中,落地速度则会相对较慢。
此外,Jain还指出,QueryData也体现了Google Cloud更宏观的战略布局。
"QueryData表明,Google正试图为AI智能体建立一套安全访问和使用数据的标准方式。OpenAI聚焦于API,AWS侧重连接器,微软专注于Copilot等应用,而Google则将目光放在数据层本身——即智能体如何与数据库进行交互,"Jain说道。
"这种方式有其优势,尤其是与Google BigQuery的深度集成以及Google在数据领域的专业积累。但也面临挑战——前期配置工作量较大,跨平台灵活性较低。相比之下,微软似乎更具优势,因为其工具已经内嵌于人们日常使用的应用中,"他补充道。
Jain还表示,Google面临的风险在于:如果来自AWS或微软更简便的解决方案成为主流,QueryData可能只能在高阶场景中发挥作用,而难以成为广泛认可的行业标准。
目前,QueryData正处于预览阶段。
Q&A
Q1:QueryData是什么?它主要解决什么问题?
A:QueryData是Google Cloud推出的一款新工具,能够将自然语言转化为数据库查询语句,准确率接近100%。它主要解决大语言模型在直接生成数据库查询时因结构理解有限和概率推理而产生的不准确问题,适用于多智能体系统和应用场景。
Q2:使用QueryData需要做哪些前期准备?
A:企业团队在使用QueryData之前,需要先定义"上下文",包括数据库结构的详细说明(表格描述、数据关系、业务含义)以及确定性查询指令。配置完成后,还需通过Gemini CLI中的上下文工程助手结合Evalbench框架对查询准确性进行迭代验证,才能正式集成到工作流中。
Q3:QueryData目前支持哪些数据库?
A:目前QueryData支持AlloyDB、CloudSQL for MySQL、CloudSQL for PostgreSQL以及Spanner,并可在BigQuery的数据智能体中直接使用,也支持通过API集成到企业自定义的智能体系统中。该工具目前处于预览阶段。
好文章,需要你的鼓励
这篇来自爱丁堡大学与谷歌DeepMind的研究发现,给AI的上下文优化器加装搜索工具,需配合束搜索训练机制才有效,否则反而损害性能。
5月18日,Dell在拉斯维加斯举办了一年一度的Dell Technologies World大会。Michael Dell做了一小时的主旨演讲,中间穿插了礼来、三星、Honeywell等客户对话,黄仁勋也上台做了一段联合展示。
印第安纳大学研究者提出WriteSAE,首次实现对循环状态语言模型矩阵缓存写入的分解与精准编辑,可将目标词出现率从33.3%提升至100%。