AI 聊天机器人的时代已成过去,越来越多的企业开始拥抱自主智能体在企业数据中自主运转的新阶段。
在近期于拉斯维加斯举办的谷歌云 Next 2026 大会上,谷歌正式发布了"智能体数据云"(Agentic Data Cloud)。这一举措既是品牌重塑,也是架构层面的升级,旨在推动企业从被动的"智能系统"向自主运转的"行动系统"转型。
谷歌数据云总经理兼副总裁 Andi Gutmans 表示:"大家都在谈论智能系统,但坦率地说,这些系统目前仍主要依靠摄取数据、回顾过去,或者尝试预测未来。"他在接受 Computer Weekly 采访时提到,随着智能体 AI 对算力需求呈指数级增长,"我们正在从人类规模向智能体规模跃迁,无论是智能体的数量,还是需要管理的工作负载,都在发生根本性变化。"
为应对智能体 AI 带来的工作负载、成本与治理挑战,谷歌此次共发布约 80 项产品更新,重点聚焦元数据管理、跨云互操作性以及分布式数据库能力。
知识目录:让智能体找到"对的数据"
对于部署 AI 智能体的企业数据团队而言,首要问题是确保模型在访问数据时能够遵守访问控制规则。Gutmans 指出,仅仅知道数据存放在哪里已远远不够——智能体还需要语义上下文,才能避免产生幻觉和错误。
"客户通常拥有 500 张客户数据表,但智能体该查哪张?"他说道。为此,谷歌推出了知识目录(Knowledge Catalog),在此前 Dataplex 治理能力的基础上进一步构建,整合来自谷歌云内部、外部云应用及第三方目录的元数据,并对元数据进行语义丰富,以映射结构化与非结构化数据之间的关联关系。
Gutmans 将知识目录形容为直接建立在现有访问控制之上的"飞轮",确保智能体无法访问或操作其无权查看的数据。
跨云数据湖仓:打破云孤岛
面对企业 IT 环境的异构现实,谷歌还推出了跨云数据湖仓(Cross-Cloud Lakehouse)。该方案允许企业在亚马逊云服务和微软 Azure 上存储的数据之上直接运行谷歌 BigQuery 和 AI 能力,同时提供与 SAP、Workday 等企业系统的零拷贝集成。
Gutmans 特别强调了概念区分:"'跨云'与'多云'有本质区别——所谓多云,不过是多个各自独立的单云环境的叠加。"
Spanner Omni:数据库走向边缘与本地部署
另一项重要更新是 Spanner Omni。谷歌云 Spanner 是一款全球分布式关系型数据库,过去与谷歌的基础设施高度绑定,依赖其存储系统以及 GPS 接收器和原子钟来保障事务一致性。
受企业对断网边缘场景及本地部署(通过谷歌分布式云实现)的强烈需求驱动,谷歌已将 Spanner 工程化改造为可独立运行的版本。
"三四年前,包括我们自己在内,没有人相信 Spanner 能够脱离谷歌云独立运行,"Gutmans 说。如今,Spanner Omni 在断网环境下提供向量处理、搜索和图计算能力,Gutmans 指出这对于本地欺诈检测等高度监管场景尤为关键。
IT 从业者转型为智能体编排者
作为智能体数据云发布的组成部分,谷歌推出了数据智能体工具包(Data Agent Kit),支持 Claude Code、Gemini CLI、Codex 及 VS Code 扩展。其目标是为开发者和数据工程师提供模型上下文协议(MCP)及必要工具,帮助他们构建自己的智能体。
Gutmans 表示,智能体 AI 的兴起意味着从业者将从编写手动流水线或 Python 脚本,转向"意图驱动开发"模式——聚焦于定义目标和期望结果,而将技术实现交由智能体完成。
"每一位从业者都将成为智能体的编排者,"他说,"无论你是业务用户、数据科学家、数据分析师、数据工程师还是开发者,都是如此。我们真正想做的,是让每个人都拥有一支智能体团队,由他们来统筹调度。"
Gutmans 同时为 Search、YouTube、Gmail 等 Alphabet 旗下产品提供数据基础设施支撑,他透露谷歌自身的站点可靠性工程(SRE)团队已在实际部署 AI 智能体。"举个例子,有一个智能体专门监控工单——一旦发现某段时间内出现多张高度相似的工单,它就会发出提醒:'这背后可能有更大的问题在发生。'"
完整技术栈的竞争优势
谈及此次系列升级,Gutmans 也不忘为谷歌"补刀"一记竞争对手,声称谷歌对从自研张量处理器、BigQuery 到 DeepMind Gemini 模型的完整技术栈的掌控,使竞争对手难以望其项背。
"像 Azure 这样的超大规模云厂商,自己没有模型,最终不得不依赖外部环境,"他表示,"至于 Databricks 这类纯数据平台供应商,既没有基础设施,也没有模型,基本上只能东拼西凑。"
Gartner 常务副总裁 Moutusi Sau 认为,谷歌智能体数据云将这家超大规模云厂商的数据平台重新定位为面向智能体的语义与编排层,直接回应了智能体失效的核心问题——这类失效往往源于数据上下文不足、语义不一致以及集成脆弱。
她同时指出,零拷贝和跨云访问等能力有助于减少数据重力和冗余,但也对语义准确性、元数据治理和性能一致性提出了更高要求。
Sau 最终呼吁企业在语义所有权、数据管理与验证方面的投入,应与工具建设并重。"若缺乏严格的治理,企业放大歧义与信任危机的速度,可能远超智能体提升生产力的速度。"
Q&A
Q1:谷歌智能体数据云是什么?和普通数据云有什么区别?
A:谷歌智能体数据云是谷歌在品牌重塑和架构升级基础上推出的新一代数据平台,核心目标是支持企业从被动的"智能系统"向自主运转的"行动系统"转型。与传统数据云相比,它更强调语义上下文管理、智能体编排能力以及跨云互操作性,让 AI 智能体能够在受控环境下自主访问和处理企业数据,而不仅仅是被动地分析和预测。
Q2:知识目录(Knowledge Catalog)具体解决了什么问题?
A:知识目录解决的是 AI 智能体"找到正确数据"的难题。企业往往拥有数百张结构相似的数据表,智能体若缺乏语义上下文,很容易访问错误数据或产生幻觉。知识目录整合谷歌云内部、外部云应用及第三方目录的元数据,并对其进行语义丰富,同时内置在现有访问控制之上,确保智能体只能访问其有权查看的数据。
Q3:Spanner Omni 和原来的谷歌云 Spanner 有什么不同?
A:原版谷歌云 Spanner 与谷歌的基础设施高度绑定,依赖 GPS 接收器和原子钟保障全球事务一致性,无法脱离谷歌云独立运行。Spanner Omni 则突破了这一限制,支持在断网边缘环境和本地数据中心独立部署,并提供向量处理、搜索和图计算能力,特别适用于本地欺诈检测等对数据主权和网络隔离有严格要求的监管场景。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。