Anthropic上个月正式推出了Claude托管智能体(Claude Managed Agents),大幅降低了构建和部署云端AI智能体的技术门槛。本周,Claude托管智能体再度升级,新增三项重要功能。
梦境机制
第一项新功能名为"梦境"(Dreaming),目前处于研究预览阶段。Anthropic表示,该功能通过"回顾过往会话、发现规律,帮助智能体实现自我优化",从而扩展了Claude的记忆能力。
梦境机制是一套定期运行的流程,会自动回顾智能体的历史会话和记忆存储,从中提炼规律,并对记忆内容进行整理优化,使智能体随时间推移持续进化。用户可自主决定介入程度:既可让梦境机制自动更新记忆,也可在变更生效前进行人工审核。
Anthropic对记忆与梦境机制如何协同提升Claude托管智能体作出了如下说明:记忆与梦境共同构成了一套面向自我进化型智能体的完整记忆体系。记忆功能让每个智能体能够在工作过程中即时记录所学内容;梦境机制则在会话间隙对这些记忆进行精炼,汇聚各智能体的共同经验,并保持记忆内容的持续更新。
成果评估
第二项新功能名为"成果"(Outcomes),允许用户明确定义智能体任务成功的判断标准。
使用该功能时,用户只需编写一份描述成功标准的评估规则,智能体便会以此为目标展开工作。系统会由一个独立的评分模块在其专属上下文窗口中对输出结果进行评估,从而避免受到智能体自身推理过程的干扰。一旦发现输出结果存在问题,评分模块会精准指出需要改进之处,智能体随即重新进行处理。此外,用户还可以预先设定成果目标,让智能体自主运行,并通过Webhook在任务完成后接收通知。
多智能体编排
第三项新功能为"多智能体编排"(Multiagent Orchestration),该工具支持"由主导智能体将任务拆解为多个子任务,并将每个子任务分配给配备专属模型、提示词和工具的专项智能体"。
举例来说,主导智能体可以统筹协调一项调查任务,同时让多个子智能体分别并行处理部署历史、错误日志、性能指标和支持工单等不同方面的工作。这些专项智能体在共享文件系统上协同运作,并将各自的处理结果汇总至主导智能体的整体上下文中。由于事件记录具有持久化特性,且每个智能体都保有自身的操作记录,主导智能体可在工作流程执行过程中随时与其他智能体进行状态同步。
Anthropic介绍,Netflix等企业已率先将Claude托管智能体投入实际应用,其平台团队已部署了多智能体编排功能。如需进一步了解Claude托管智能体及本周推出的三项新功能,可访问Anthropic官网获取详细信息。
Q&A
Q1:Claude托管智能体的"梦境"功能是什么?它如何帮助智能体自我提升?
A:梦境(Dreaming)是Claude托管智能体的一项记忆优化功能,目前处于研究预览阶段。它通过定期回顾智能体的历史会话和记忆存储,自动提炼规律并整理记忆内容,使智能体随时间持续进化。用户可选择让系统自动更新记忆,也可在变更生效前进行人工审核,灵活掌控介入程度。
Q2:Claude托管智能体的"成果"功能具体怎么用?
A:使用成果(Outcomes)功能时,用户需编写一份描述任务成功标准的评估规则。智能体会以此为目标执行任务,完成后由独立评分模块在专属上下文窗口中对输出结果进行评估,避免受智能体自身推理干扰。若结果不符合标准,评分模块会指出问题所在,智能体随即重新处理。用户还可通过Webhook在任务完成后接收通知。
Q3:多智能体编排功能在实际场景中是如何应用的?
A:多智能体编排(Multiagent Orchestration)允许主导智能体将复杂任务拆解为多个子任务,分配给各自配备专属模型和工具的专项智能体并行处理。例如在故障排查场景中,主导智能体统筹全局,子智能体分别负责部署历史、错误日志、性能指标和支持工单等不同维度的分析。Netflix平台团队已率先将该功能部署于实际业务中。
好文章,需要你的鼓励
火箭实验室(Rocket Lab)宣布计划以现金加股票方式,斥资80亿美元收购主要卫星运营商铱星通信(Iridium Communications),交易预计于2027年中完成。铱星目前运营着由66颗活跃低轨卫星组成的星座网络,拥有约255万活跃用户,2024年营收达8.717亿美元。收购完成后,Rocket Lab计划借助其新型重型运载火箭Neutron及Lightning卫星平台,扩大铱星星座规模,开拓未被覆盖的市场并降低发射成本。
谷歌研究院开发的论文助手工具PAT,利用分阶段深度推理流水线自动审查学术论文,在真实错误检测任务上达到89.7%召回率,并已在STOC和ICML两大顶会完成超4700篇论文的真实部署。
音乐流媒体平台Tidal宣布,将于7月中旬启用自动化工具,对完全由AI生成的音乐添加"AI"标识,并移除具有欺诈性质的曲目。平台还将取消AI生成音乐的版税资格,仅向真人创作、演唱的原创音乐开放变现渠道。此外,Tidal明确将高频异常上传、干扰真实艺术家等行为列为欺诈活动。Deezer、Spotify等竞争对手此前已推出类似检测机制,流媒体行业正加速构建AI内容治理体系。
香港大学与武汉大学联合开发的EO-WM系统,将地球观测卫星图像预测重新定义为天气驱动的世界建模问题,通过把气象信号拆解为气候基线、天气异常和累积压力三层,显著提升了对极端干旱和热浪事件下植被退化的预测准确性。