智能体AI的现状与未来：MIT教授深度解析

MIT电子工程与计算机科学系副教授Phillip Isola接受采访，深入解析了AI智能体的本质与发展。AI智能体是能在现实或数字世界中主动执行任务的系统，与生成式AI的核心区别在于"行动能力"。目前编程领域是其最成熟的应用场景。然而，训练数据匮乏、人类过度依赖导致的技能退化，以及高风险场景下的决策失误，仍是主要挑战。未来AI智能体能否突破语言模型架构局限，仍是业界最大争议。

AI智能体的部署近年来呈现爆炸式增长。麻省理工学院斯隆管理学院与波士顿咨询集团于2025年11月发布的一份报告显示，35%的受访企业已经部署了AI智能体，另有44%的企业计划在近期落地智能体AI。

为深入理解这些日益普及的工具的基本原理及其潜在影响，MIT新闻采访了电气工程与计算机科学系（EECS）副教授、计算机科学与人工智能实验室（CSAIL）成员Phillip Isola。他长期研究AI智能体所具备的智能，以及驱动智能体AI系统运作的底层模型与机制。

什么是智能体AI，它与ChatGPT、Claude等生成式AI有何不同？

智能体AI是一种能够在真实世界中执行操作的AI。这些操作可以是物理动作，例如机器人操控；也可以是数字动作，例如预订机票。相比之下，生成式AI更多是用来创作故事、诗歌、艺术和图像，而不是代替我们采取行动。

"智能体"这个词只是一个品牌标签，通常指帮助人们与应用程序、网站或物理世界进行交互的AI。我们今天接触到的大多数智能体都是数字智能体，比如可以处理产品投诉的客服智能体。

大多数提供智能体服务的公司，在底层使用的是同一批AI模型，并赋予其执行操作和记忆历史信息的能力。一个智能体的核心通常是Claude这样的基础生成式AI系统，然后各公司会根据自身产品或应用场景，在这个基础模型外面包裹不同的功能层。这些功能层可能包括特定工具，具体取决于应用场景。比如，智能体可能接入计算器来解决数学问题，也可能接入更复杂的存储系统和操作系统，从而记住某家公司的财务数据和过往商业谈判内容。

开发智能体AI面临的最大挑战来自训练数据的匮乏。如果我想创建一个能上网帮我订机票的系统，听起来似乎很简单。但实际上，我们并没有大量详细描述如何完成这件事的数据——比如鼠标应该移到哪里、点击哪个按钮、出错时该怎么处理，或者如何打电话协商机票价格。训练这类系统的一种方式，是让AI智能体自行访问航空公司网站，反复尝试，从成败中学习。由于这些环境很难建模，智能体往往只能通过试错来成长。

智能体AI有哪些值得期待的应用场景？

目前取得最显著成果的领域是编程智能体。这是从生成式AI发展而来的。人们用代码训练大语言模型，使其能够预测人类解决编程问题时的操作路径。此外，智能体还可以通过反馈循环来学习——不断尝试不同的解决方案，并验证结果是否正确。只要能够检验答案，AI智能体就可以持续进行这种试错循环，直到找到有效策略。

但自动化决策与辅助人类决策之间，始终需要保持平衡。分析类AI方法——例如帮助预测决策可能结果的系统——并不具备智能体属性，但对人类决策者而言极具参考价值。对于医疗、安全、高层商业政策等高风险或安全关键型场景，技术可能尚未成熟到能够完全自动化这些流程，而且我们自身也未必愿意接受这种程度的自动化。

使用AI智能体时，有哪些风险需要关注？

一大风险在于，AI智能体往往能很轻松地帮你完成某些工作。以编程智能体为例，你可以"凭感觉写代码"，直接让智能体帮你生成代码，省去了自己动手的麻烦。但正因为太过便捷，人们可能不会花足够的精力去核验结果是否正确。由此带来的后果是：代码漏洞被引入，私人数据遭到泄露——这些问题已经在现实中发生。

智能体并非无懈可击，它们可能因训练不足或面对陌生情境而出错。但即便智能体本身能力很强，如果人类使用不当，或给出的指令过于模糊，智能体同样可能因为人的失误而出错。一旦人类减少对各种后果的深入思考，我认为我们犯错的概率会更高。

此外，技能退化也是一个不容忽视的风险。当我们越来越依赖智能体来完成作业、编程和数学运算时，我们自身的能力可能会逐渐退化。更令人担忧的是，这种退化可能发生得过早，而彼时技术尚不足以完全承担这些任务。

智能体AI的未来走向何方？

我们现在所说的智能体AI，通常是指大语言模型借助工具与数字和物理系统进行交互。一个显而易见的局限在于，这些系统在底层采用的是语言模型架构，训练数据也以文本为主。要构建更强大的AI智能体，我们可能需要处理视频、物理力学、时间序列、雷达扫描等多种数据模态，也可能需要从根本上采用不同的架构，以应对连续数据、高维数据和随机数据等挑战。

但另一方面，也许一个极其出色的编程模型，就能充当"幕后操控者"，与传感器、执行器和网络API进行对接？一旦拥有一个能够理解数学、语言和代码的超级推理系统，给它配上摄像头和键盘，它也许就能自行摸索出如何应对空间领域的挑战。下一波AI浪潮，究竟是"配备了传感器、执行器和工具的Claude"，还是从底层全新构建的全新形态？这正是AI领域众多研究者当下正在深思的核心问题。

Q&A

Q1：智能体AI和生成式AI有什么区别？

A：生成式AI主要用于生成内容，比如文章、图像、诗歌等；而智能体AI的核心在于"行动"，它能在数字或物理世界中执行具体操作，比如预订机票、处理客服投诉等。大多数智能体AI是在生成式AI基础模型（如Claude）之上，加入工具调用和记忆能力构建而成的。

Q2：AI智能体在哪些领域应用效果最好？

A：目前最成功的应用是编程智能体。由于编程任务的答案可以被明确验证，AI智能体可以通过不断试错和反馈循环来优化策略，效果显著。相比之下，医疗、安全等高风险领域由于对可靠性要求极高，目前尚不适合完全交由AI智能体自主决策。

Q3：使用AI智能体会带来哪些风险？

A：主要有三类风险：一是验证不足，人们因为使用便捷而忽视结果核验，导致代码漏洞或数据泄露；二是人为指令失误，模糊或错误的指令会让智能体做出错误行为；三是技能退化，长期依赖智能体可能导致人类自身能力下降，而技术目前尚不足以完全替代人类判断。

来源：MIT News

0赞

好文章，需要你的鼓励

智能体AI的现状与未来：MIT教授深度解析

来源：MIT News

2026

07/01

17:49

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

Claude Science发布：Anthropic押注工作流布局科学研究领域

Google最快最便宜图像模型Gemini 3.1 Flash Lite Image正式发布

Acti：将AI智能体直接嵌入智能手机键盘

Nvidia竞争对手Etched估值达50亿美元，AI芯片订单突破10亿美元

Claude Sonnet 5正式发布：更低成本运行AI智能体

智能体成为职场新同事，如何与AI协作取得最佳成果

美国61%的成年人现在使用AI获取健康信息，2024年这一比例仅为2%

谷歌发布速度更快、价格更低的图像生成模型

三位DeepMind前研究员将扑克AI技术应用于量化对冲基金交易

TabFM：面向表格数据的零样本基础模型正式发布

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

打造Token极致性价比新华三震撼亮相2026世界人工智能大会