Google在其用于构建AI驱动小程序的Opal工具中新增了智能体步骤。据Google介绍,这一基于Gemini 3 Flash模型的新智能体能够代表用户执行自主工作流程,包括规划、推理和执行操作。
这一智能体步骤于2月24日推出,面向所有Opal用户开放。据Google表示,该功能将Opal工作流程从静态模型调用升级为具备智能体能力的智能系统。现在,开发者无需手动选择模型,可以在"生成"步骤中直接选择智能体。智能体会自动触发完成用户目标任务所需的正确工具和模型,例如用于研究的网络搜索功能或用于视频的Veo工具。智能体还能够利用持久化内存、动态路由和与用户的交互式对话功能。
持久化内存功能
通过持久化内存,智能体可以利用Google Sheets在多个会话间记住信息,如风格偏好或持续更新的列表,使小程序在使用过程中变得越来越智能。
动态路由功能
借助动态路由,智能体能够评估工作进度并决定接下来触发哪些步骤,为小程序带来自主性。
交互式对话功能
通过交互式对话,智能体可以主动与用户聊天,收集缺失信息或在进入计划下一阶段前提供选择建议。
Google展示了一个实际应用案例:之前创建故事书Opal需要预先定义页面数量和用户问题。现在用户可以构建一个视觉故事讲述器Opal,其中智能体步骤能够自主决定需要哪些详细信息,并建议情节要点来帮助指导故事发展方向。Google表示,这标志着从固定格式向由创意决策塑造的动态、独特叙述的转变。
Q&A
Q1:Opal工具的智能体功能有什么特别之处?
A:Opal的智能体功能基于Gemini 3 Flash模型,能够代表用户执行自主工作流程,包括规划、推理和执行。它可以自动选择合适的工具和模型,如网络搜索或Veo视频工具,无需开发者手动选择,实现了从静态模型调用到智能化操作的升级。
Q2:持久化内存功能如何让小程序变得更智能?
A:持久化内存功能允许智能体利用Google Sheets在多个会话间记住重要信息,比如用户的风格偏好或持续更新的列表。这意味着小程序会随着使用次数增加而变得越来越了解用户需求,提供更个性化和智能的服务体验。
Q3:动态路由和交互式对话功能有什么实际用途?
A:动态路由让智能体能够评估当前工作进度并自主决定下一步操作,为小程序带来自主性。交互式对话功能则允许智能体主动与用户沟通,收集必要信息或在关键节点提供选择建议,确保任务能够顺利进行并满足用户期望。
好文章,需要你的鼓励
黑客利用Meta AI客服聊天机器人成功入侵多个高知名度Instagram账户,受害者包括奥巴马白宫账号、丝芙兰及美国太空部队总军士长账户。黑客通过诱导AI助手将目标账户绑定至新邮箱,从而完成密码重置,部分黑客还借助VPN绕过Meta的安全防护。Meta已确认该漏洞并表示问题已修复,但受影响账户数量尚不明确。此事件引发外界对AI参与关键安全环节的广泛担忧。
MoZoo是由清华大学等机构联合研究的AI动物特效系统,可将光秃秃的网格模型视频直接转换为毛发逼真的动物视频,大幅跳过传统骨骼绑定和毛发模拟流程。
通用汽车首席产品官斯特林·安德森将当前工程开发定义为"第三纪元"——以AI/ML驱动的概率化设计方法,正在颠覆传统串行开发流程。过去需要15小时的有限元分析,现在仅需1分钟;碰撞测试、整车操控、HVAC系统优化均可在虚拟环境中同步进行。工程师无需等待隔夜仿真结果,可快速迭代数千种设计方案,显著提升创新效率。该技术还延伸至赛车运动、电池、国防及月球项目等多个业务板块。
中科院软件所提出LiteCoder-Terminal-Gen,一套无需外部数据、完全自动合成终端训练环境的框架,用11255条专家轨迹训练出能独立操控命令行的AI模型。