一个人工智能引擎回答问题已经很强大,但一整个团队的智能体协作效果更佳。在个体"AI智能体"开创性发展之后,专家称之为AI的"智能体时代"到来,研究人员发现让多个数字实体相互对话能产生更好的结果。
正如古话所说"三个臭皮匠,顶个诸葛亮",无论是人脑还是硬件中的智能系统,这个道理都成立。
Google DeepMind成为这类研究的重要阵地,先锋团队正在开发前沿的多智能体系统,这些系统可以相互咨询、共同头脑风暴并产生新颖见解。一个解释视频展示了"老板"和"团队成员"(由AI智能体模拟)如何为人类受众开发结果。
UGO分析师在博客文章中写道:"Deep Think的核心是在面临具有挑战性的任务时,协调几个内部智能体——每个都具有独特的启发式方法、训练重点或推理技能。"该文章记录了Google Gemini 2.5 "Deep Think"功能在2025年8月的出现。
会议室里的对话
让我们回到最近的一次Ted演讲,DeepMind的Vivek Natarajan向我们详细解释了这项技术的工作原理和起源。
对他来说,这项研究很私人:在父亲死于帕金森病后,他开始致力于为未来几代人预防这类疾病的影响。他说,为此我们需要新的模型。
"仅仅训练更大的AI系统是不够的,"Natarajan说。"我们真正需要能够教AI系统思考,特别是进行那种缓慢、深思熟虑、系统性思维,这是真正科学和科学家的标志。"
改变游戏规则
Natarajan描述了这些系统的演进。
"我们建立并借鉴了支撑突破的原则......AI智能体相互对抗,通过称为自我对弈的过程来改进,"他说。"但在这里,我们的AI智能体不是玩游戏,而是用自然语言相互交流,批评、完善和改进他们的想法。这个过程持续数天,有时甚至数周,这就是AI系统最终学会解决复杂问题的方式。"
超越人类基准
这种团队AI方法的有效能力之一是速度。Natarajan谈到多智能体AI如何快速完成困扰人类团队的过程,他举了伦敦帝国学院项目的例子,人类花了数年时间,而AI在两天内就完成了。
"人类花了大约十年的艰苦、杰出研究来解决与抗菌素耐药性相关的复杂难题,"他说。"我们向AI共同科学家团队提出了同样的研究问题。它思考了几天,然后最终重现了他们整整十年的发现。十年对比两天。"
实现应用
Natarajan记录了这类研究的一些具体用例和应用。
"科学家用AI帮助识别出急性髓性白血病的新药物再利用候选物,"他说。"借助它,斯坦福大学的研究人员发现了逆转肝损伤的治疗方法,甚至帮助我们设计出更高效的细胞再生蛋白质......这些发现正在今天发生,这真的令人兴奋。"
那么以这种方式训练的系统的床边态度如何呢?
Natarajan回顾了他称为"Amy"的AI临床医生部署的一些想法,表明除了产生见解外,AI也能很好地与人类协商。
"与人类医生相比,它实际上产生了更好的诊断和护理计划,"他指出。"但也许更深刻的是,AI实际上被创造得比医生本身更有同理心。"
他警告说,这并不意味着AI应该完全接管,我们不需要人类参与其中。
"这不是关于替代,"他说。"这是关于合作。"
所以放松吧,医生们。AI还没有来抢你们的工作。事实上,OpenAI、Anthropic和Google等公司掌舵人中的许多行业领袖都采取同样的策略——建议AI应该是辅助性的、增强性的,而不是人类才能的替代品。
"这种AI系统的真正前景是从根本上民主化医疗保健访问,为数十亿人提供健康计划,"Natarajan告诉我们。"想象一下每个人、每个地方的口袋里都有一位医生。想象一下对印度偏远村庄的人们,或非洲农村社区人们的影响。这是医疗保健提供的根本性范式转变,现在我们有了同一枚硬币的两面,一个AI共同定位来民主化医疗保健访问并最大化我们的健康寿命,一个AI共同科学家来策划生物医学发现并延长我们的寿命。"
这是重要的技术。
最后,Natarajan对2020年代梦想成为现实的方式充满热情。
"几年前这感觉像科幻小说,"他说。"现在是科学事实。这曾经感觉像登月计划。现在它只是一个任务。这曾经感觉不可想象。现在它不仅可以想象,而且可以做到。事实上,我真正相信在十年内,我们将能够以零边际成本向每个人、每个地方提供医疗保健,并且对用AI治愈所有疾病有明确的预期——我们正在构建那幅图景,那台时间机器。"
同样,这相当惊人。在未来几十年的职业生涯和生活中,我们会在多元宇宙的大厅里与AI智能体团队对话吗?让我们拭目以待。
Q&A
Q1:多智能体AI协作是什么?它与单个AI有什么不同?
A:多智能体AI协作是让多个AI智能体相互对话、协商和合作的技术。与单个AI不同,多个智能体可以相互咨询、共同头脑风暴,每个智能体都有独特的启发式方法、训练重点或推理技能,通过自然语言交流来批评、完善和改进想法。
Q2:Google DeepMind的Deep Think技术有多快?
A:Deep Think技术在速度上表现惊人。例如,伦敦帝国学院的研究人员花了十年时间解决抗菌素耐药性相关的复杂难题,而AI共同科学家团队只用了两天就重现了他们整整十年的发现成果。
Q3:多智能体AI在医疗领域有哪些具体应用?
A:多智能体AI在医疗领域已有多项具体应用:帮助识别急性髓性白血病的新药物再利用候选物,协助斯坦福大学研究人员发现逆转肝损伤的治疗方法,设计更高效的细胞再生蛋白质。AI临床医生"Amy"还能产生比人类医生更好的诊断和护理计划。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。