Google Cloud推出了一款新工具QueryData,旨在提升多智能体系统或应用中,AI智能体查询数据库时的准确性。
QueryData能够将自然语言转化为数据库查询语句,Google声称其准确率"接近100%"。该工具被定位为大语言模型直接生成查询语句的替代方案。Google指出,大语言模型由于对数据库结构理解有限,且依赖概率推理,在直接生成查询时容易产生不准确的结果。
不过,要建立这种必要的数据理解能力,使用QueryData的企业团队首先需要定义Google所称的"上下文",即描述数据应如何被访问和查询的相关信息。这一过程涉及对数据库结构的详细编码,包括表格说明、数据关系、业务含义,以及指导查询生成或执行方式的确定性指令。
一旦上下文和规则配置完成,团队便可使用"上下文工程助手"(Context Engineering Assistant)——这是Gemini CLI中的一个专属智能体,可基于Evalbench评估框架对查询准确性进行迭代审查,直至达到满意效果。
完成上述配置后,QueryData可集成到智能体驱动的工作流中,作为用户请求与底层数据库之间的执行层。
QueryData既可在Google Cloud自有的数据智能体中使用(目前已在BigQuery中上线),也可通过API由企业自行调用,用于构建自定义智能体和多智能体系统。目前该工具支持AlloyDB、CloudSQL for MySQL、CloudSQL for PostgreSQL及Spanner。
Google在一篇博客文章中解释道:在自定义配置中,智能体负责推理与编排,而QueryData则负责针对数据源生成、验证和执行查询,并将结果返回,供后续操作或决策使用。
Pareekh Consulting首席分析师Pareekh Jain认为,这一新工具标志着AI从工具型向内置护栏的结果导向型智能体转变,有助于企业将多智能体系统和应用推向生产环境,并在金融、运营和供应链等部门实现"决策级应用场景"。
然而,他也提出了警示:尽管QueryData降低了开发人员在提示工程方面的工作量,并提升了运行时的可靠性,但这实际上将工作重心转移到了前期设计和持续维护上。
"它要求对数据库结构有清晰的理解,需要针对每个数据源编写确定性指令,并随着结构的演变持续维护,"他指出,"这实际上为智能体创造了一个全新的工作类别——数据访问工程。"
他表示:"这种权衡非常明显。不用QueryData,系统构建更快但生产环境中不够可靠;使用QueryData,构建周期更长,但在大规模场景下具备可行性。"
Jain认为,这种权衡最终将影响企业的使用模式——在受监管和关键任务环境中,采用率可能最高;而在轻量级或实验性场景中,落地速度则会相对较慢。
此外,Jain还指出,QueryData也体现了Google Cloud更宏观的战略布局。
"QueryData表明,Google正试图为AI智能体建立一套安全访问和使用数据的标准方式。OpenAI聚焦于API,AWS侧重连接器,微软专注于Copilot等应用,而Google则将目光放在数据层本身——即智能体如何与数据库进行交互,"Jain说道。
"这种方式有其优势,尤其是与Google BigQuery的深度集成以及Google在数据领域的专业积累。但也面临挑战——前期配置工作量较大,跨平台灵活性较低。相比之下,微软似乎更具优势,因为其工具已经内嵌于人们日常使用的应用中,"他补充道。
Jain还表示,Google面临的风险在于:如果来自AWS或微软更简便的解决方案成为主流,QueryData可能只能在高阶场景中发挥作用,而难以成为广泛认可的行业标准。
目前,QueryData正处于预览阶段。
Q&A
Q1:QueryData是什么?它主要解决什么问题?
A:QueryData是Google Cloud推出的一款新工具,能够将自然语言转化为数据库查询语句,准确率接近100%。它主要解决大语言模型在直接生成数据库查询时因结构理解有限和概率推理而产生的不准确问题,适用于多智能体系统和应用场景。
Q2:使用QueryData需要做哪些前期准备?
A:企业团队在使用QueryData之前,需要先定义"上下文",包括数据库结构的详细说明(表格描述、数据关系、业务含义)以及确定性查询指令。配置完成后,还需通过Gemini CLI中的上下文工程助手结合Evalbench框架对查询准确性进行迭代验证,才能正式集成到工作流中。
Q3:QueryData目前支持哪些数据库?
A:目前QueryData支持AlloyDB、CloudSQL for MySQL、CloudSQL for PostgreSQL以及Spanner,并可在BigQuery的数据智能体中直接使用,也支持通过API集成到企业自定义的智能体系统中。该工具目前处于预览阶段。
好文章,需要你的鼓励
火箭实验室(Rocket Lab)宣布计划以现金加股票方式,斥资80亿美元收购主要卫星运营商铱星通信(Iridium Communications),交易预计于2027年中完成。铱星目前运营着由66颗活跃低轨卫星组成的星座网络,拥有约255万活跃用户,2024年营收达8.717亿美元。收购完成后,Rocket Lab计划借助其新型重型运载火箭Neutron及Lightning卫星平台,扩大铱星星座规模,开拓未被覆盖的市场并降低发射成本。
谷歌研究院开发的论文助手工具PAT,利用分阶段深度推理流水线自动审查学术论文,在真实错误检测任务上达到89.7%召回率,并已在STOC和ICML两大顶会完成超4700篇论文的真实部署。
音乐流媒体平台Tidal宣布,将于7月中旬启用自动化工具,对完全由AI生成的音乐添加"AI"标识,并移除具有欺诈性质的曲目。平台还将取消AI生成音乐的版税资格,仅向真人创作、演唱的原创音乐开放变现渠道。此外,Tidal明确将高频异常上传、干扰真实艺术家等行为列为欺诈活动。Deezer、Spotify等竞争对手此前已推出类似检测机制,流媒体行业正加速构建AI内容治理体系。
香港大学与武汉大学联合开发的EO-WM系统,将地球观测卫星图像预测重新定义为天气驱动的世界建模问题,通过把气象信号拆解为气候基线、天气异常和累积压力三层,显著提升了对极端干旱和热浪事件下植被退化的预测准确性。