Anthropic上个月正式推出了Claude托管智能体(Claude Managed Agents),大幅降低了构建和部署云端AI智能体的技术门槛。本周,Claude托管智能体再度升级,新增三项重要功能。
梦境机制
第一项新功能名为"梦境"(Dreaming),目前处于研究预览阶段。Anthropic表示,该功能通过"回顾过往会话、发现规律,帮助智能体实现自我优化",从而扩展了Claude的记忆能力。
梦境机制是一套定期运行的流程,会自动回顾智能体的历史会话和记忆存储,从中提炼规律,并对记忆内容进行整理优化,使智能体随时间推移持续进化。用户可自主决定介入程度:既可让梦境机制自动更新记忆,也可在变更生效前进行人工审核。
Anthropic对记忆与梦境机制如何协同提升Claude托管智能体作出了如下说明:记忆与梦境共同构成了一套面向自我进化型智能体的完整记忆体系。记忆功能让每个智能体能够在工作过程中即时记录所学内容;梦境机制则在会话间隙对这些记忆进行精炼,汇聚各智能体的共同经验,并保持记忆内容的持续更新。
成果评估
第二项新功能名为"成果"(Outcomes),允许用户明确定义智能体任务成功的判断标准。
使用该功能时,用户只需编写一份描述成功标准的评估规则,智能体便会以此为目标展开工作。系统会由一个独立的评分模块在其专属上下文窗口中对输出结果进行评估,从而避免受到智能体自身推理过程的干扰。一旦发现输出结果存在问题,评分模块会精准指出需要改进之处,智能体随即重新进行处理。此外,用户还可以预先设定成果目标,让智能体自主运行,并通过Webhook在任务完成后接收通知。
多智能体编排
第三项新功能为"多智能体编排"(Multiagent Orchestration),该工具支持"由主导智能体将任务拆解为多个子任务,并将每个子任务分配给配备专属模型、提示词和工具的专项智能体"。
举例来说,主导智能体可以统筹协调一项调查任务,同时让多个子智能体分别并行处理部署历史、错误日志、性能指标和支持工单等不同方面的工作。这些专项智能体在共享文件系统上协同运作,并将各自的处理结果汇总至主导智能体的整体上下文中。由于事件记录具有持久化特性,且每个智能体都保有自身的操作记录,主导智能体可在工作流程执行过程中随时与其他智能体进行状态同步。
Anthropic介绍,Netflix等企业已率先将Claude托管智能体投入实际应用,其平台团队已部署了多智能体编排功能。如需进一步了解Claude托管智能体及本周推出的三项新功能,可访问Anthropic官网获取详细信息。
Q&A
Q1:Claude托管智能体的"梦境"功能是什么?它如何帮助智能体自我提升?
A:梦境(Dreaming)是Claude托管智能体的一项记忆优化功能,目前处于研究预览阶段。它通过定期回顾智能体的历史会话和记忆存储,自动提炼规律并整理记忆内容,使智能体随时间持续进化。用户可选择让系统自动更新记忆,也可在变更生效前进行人工审核,灵活掌控介入程度。
Q2:Claude托管智能体的"成果"功能具体怎么用?
A:使用成果(Outcomes)功能时,用户需编写一份描述任务成功标准的评估规则。智能体会以此为目标执行任务,完成后由独立评分模块在专属上下文窗口中对输出结果进行评估,避免受智能体自身推理干扰。若结果不符合标准,评分模块会指出问题所在,智能体随即重新处理。用户还可通过Webhook在任务完成后接收通知。
Q3:多智能体编排功能在实际场景中是如何应用的?
A:多智能体编排(Multiagent Orchestration)允许主导智能体将复杂任务拆解为多个子任务,分配给各自配备专属模型和工具的专项智能体并行处理。例如在故障排查场景中,主导智能体统筹全局,子智能体分别负责部署历史、错误日志、性能指标和支持工单等不同维度的分析。Netflix平台团队已率先将该功能部署于实际业务中。
好文章,需要你的鼓励
SAP首席执行官Christian Klein在2026年Sapphire大会上坦承,公司约在八九个月前调整了AI战略方向,从强调AI技术本身转向聚焦业务成果,目标是实现"自主企业"愿景。SAP发布了全新品牌SAP Business AI和SAP Autonomous Suite,重构AI平台以更好融入客户业务上下文。SAP高管还强调,需防范"智能体失控"风险,并引入"企业记忆"概念提升AI决策的精准度。
研究揭示多源视觉融合并非总有益,提出MARS框架通过单源锚点量化信息增益,动态调节多源融合优势,在多个视觉推理任务上实现显著性能提升。
英国卫生与社会保障部发布测算数据,显示NHS数字化单一患者记录(SPR)每年可减少约2万次急诊就诊,并节省约2000万英镑。该计划将强制要求全科医生和医院共享患者数据,形成统一的健康档案,患者可通过NHS App访问。该措施是政府100亿英镑医疗数字化计划的核心。此外,NHS虚拟医院NHS Online已正式成立,预计2027年上线,首三年可提供约850万次诊疗服务。
MiniMax发布M2系列混合专家大模型,总参数2299亿但每次仅激活98亿,通过专项数据流水线、Forge强化学习系统和自进化机制,在代理编程、深度搜索等任务上达到顶级闭源模型水平。