Google推出开源Agent Executor运行时支持企业级AI智能体生产部署
Google推出了Agent Executor,这是一个开源运行时工具,旨在帮助企业更可靠地大规模运行AI智能体。随着业界关注点从构建智能体原型转向管理生产环境中的运营挑战,这一工具应运而生。
为了应对这些生产相关的挑战,Google表示,该运行时具备支持长时间运行和分布式智能体工作流的能力。
通常,长时间运行的智能体工作流是指AI驱动的任务,执行时间从几分钟到数天不等,往往涉及多个步骤、系统交互、等待人工输入或从中断中恢复,然后才能完成。
针对此类工作负载,该运行时包含对持久化执行的支持,允许工作流在系统中断或人工审批后恢复运行。此外还提供安全沙箱来隔离智能体组件、分布式工作流的会话一致性控制,以及旨在在网络中断期间保持执行状态的连接恢复功能,Google在博客文章中写道。
该运行时还支持"轨迹分支"功能,允许开发人员从保存的检查点测试备用执行路径,而不会丢失先前的上下文。
此外,Agent Executor支持多种部署模式,包括本地部署、预构建或自定义托管智能体。Google表示,用户可以根据需要在Google Antigravity、Google构建的前沿智能体、用户构建并由Google管理的智能体、自定义智能体以及使用Agent2Agent(A2A)协议的智能体之间进行任意组合。
分析师和专家认为Agent Executor的功能对开发人员和企业都具有价值。
Broadcom高级可靠性工程师Advait Patel表示:"持久性、编排和可恢复性是任何企业生产智能体的真正障碍。"
他指出:"扼杀企业采用的是那些在pod重启时丢失状态的智能体、在并发写入下损坏的会话,或者无法从网络故障中恢复的长时间运行工作流。一旦你的智能体在真实系统上执行操作,你就不能让它在执行到一半时忘记自己做了什么。"
Patel指出:"Agent Executor中的事件日志、快照、单写入器模型和连接恢复正是SRE团队在过去一年中一直在临时拼凑的功能。"他补充说,LangChain和AutoGen等现有框架非常适合原型开发,但在智能体运行数小时或数天后,在生产环境中往往会崩溃。
Avasant研究总监Gaurav Dewan表示,对于CIO来说,该运行时的操作保障措施(如安全沙箱和检查点)对于事件分析和可审计性同样重要。
同时,他警告说,仅凭运行时的功能并不能解决CIO在企业AI部署中持续面临的更广泛的治理和监督挑战。
他说:"问责制、智能体决策的可解释性、策略执行以及跨互联系统的安全访问等问题仍在不断发展。因此,虽然分布式运行时可以加强智能体部署的运营基础,但CIO层面关于信任、合规性和企业控制的考虑可能需要在运行时基础设施之外增加额外的治理和监督层。"
然而,Google并非唯一试图塑造企业AI智能体新兴基础设施层的公司。其他云服务巨头,如微软的AutoGen和AWS的Bedrock AgentCore,也在推广开放或可互操作的框架以获得战略优势。
Dewan说:"越来越多的迹象表明,云服务巨头正在趋向于一种模式,即在技术栈顶部结合开放或可互操作的工具,同时将货币化集中在底层基础设施层。"
他补充说:"Google、微软和AWS越来越多地提供SDK、智能体框架和编排工具来推动开发者采用和生态系统增长,同时继续通过计算基础设施、托管AI平台、数据服务和可观测性功能创造价值。"
根据Patel的说法,Google围绕Agent Executor的策略让人想起该云服务巨头十年前在Kubernetes上采取的路径:"免费提供运行时,通过Gemini企业智能体平台和托管智能体API等服务推动Google Cloud的消费。"
他补充说:"云服务巨头已经意识到,专有智能体框架不会在企业规模上被采用。真正的利润在于云消费、托管服务和模型推理。顶层的工具需要开源,否则没有人会信任它们。"
Q&A
Q1:Google Agent Executor是什么?它有什么作用?
A:Agent Executor是Google推出的一个开源运行时工具,旨在帮助企业更可靠地大规模运行AI智能体。它提供持久化执行、安全沙箱、会话一致性控制和连接恢复等功能,支持长时间运行和分布式智能体工作流,解决智能体在生产环境中的运营挑战。
Q2:Agent Executor解决了AI智能体部署的哪些痛点?
A:Agent Executor主要解决了企业生产环境中智能体的持久性、编排和可恢复性问题。它能让智能体在系统重启后保持状态、避免并发写入时会话损坏、从网络故障中恢复长时间运行的工作流。这些功能对于需要在真实系统上执行操作的企业级智能体至关重要。
Q3:Google为什么要开源Agent Executor?
A:Google的策略类似于十年前推广Kubernetes的做法,即免费提供运行时工具来推动开发者采用和生态系统增长,同时通过底层的云计算基础设施、托管AI平台、数据服务和模型推理等服务实现商业价值。开源工具更容易获得企业信任和大规模采用。
好文章,需要你的鼓励
随着制造商面临提升生产力、质量和韧性的压力,自动化正成为现代工厂运营的核心。全球最大合同制造商之一Flex近期扩大了与Teradyne Robotics的合作,将在自有工厂部署机器人解决方案并为客户制造关键机器人组件。该公司运营卓越与转型总裁分享了从试点项目到大规模实施的经验,探讨协作机器人、自主移动机器人如何平衡灵活性与标准化,以及物理AI在工厂环境中的实际应用前景。
研究揭示多源视觉融合并非总有益,提出MARS框架通过单源锚点量化信息增益,动态调节多源融合优势,在多个视觉推理任务上实现显著性能提升。
仓储自动化已进入新阶段,技术挑战从单一任务验证转向规模化部署。Plus One Robotics运营副总裁Christina Gomez-Terry分享了该公司累计完成20亿次拣选后的经验:硬件故障往往在大规模部署后才显现,可维护性和可靠性比峰值性能更重要,人机协作将是长期运营模式,而系统集成可能成为仓储自动化的下一个主要瓶颈。
MiniMax发布M2系列混合专家大模型,总参数2299亿但每次仅激活98亿,通过专项数据流水线、Forge强化学习系统和自进化机制,在代理编程、深度搜索等任务上达到顶级闭源模型水平。