
AI Agent行业综述——定义及基础架构
AI Agent(人工智能体)是一种能够感知环境、进行决策和执行动作的智能实体。不同于传统的人工智能,AI Agent具备通过独立思考、调用工具去逐步完成给定目标的能力。AI Agent和大模型的区别在于,大模型与人类之间的交互是基于prompt实现的,用户prompt是否清晰明确会影响大模型回答的效果。而AI Agent的工作仅需给定一个目标,它就能够针对目标独立思考并做出行动。
下载链接:
1、2024年中国AI Agent研究:创新驱动,智能技术革新
2、中国AI Agent行业研究:智能体落地千行百业,引领智能化革命的新引擎
AI Agent行业词条报告:驱动智能交互变革,重塑服务生态
1、面向办公自动化领域的 AI Agent 建设思考与分享
2、AI Agent 在企业经营分析场景的落地
3、LLM和Multi-Agent在运维领域的实验探索

一个基于大模型的AI Agent系统可以拆分为LLM(大模型)、记忆(Memory)、任务(Planning)以及工具使用(Tool)的集合。在LLM为基础的AI Agent系统中,大模型为AIAgent系统的大脑负责计算,并需要其他组件进行辅助。
AI Agent行业综述——人机协同模式差异
人类与AI协同的三种模式包括嵌入模式(Embedding)、副驾驶模式(Copilot)和智能体模式(Agent),相较于前两种模式,智能体模式更为高效,或将成为未来人机协同的主要模式。

基于大模型的Agent不仅可以让每个人都有增强能力的专属智能助理,还将改变人机协同的模式。带来更加广泛的人机融合。生成式AI带来的人机协同,将会呈现三种模式:嵌入模式(Embedding)、副驾驶模式(Copilot)和智能体模式(Agent)。相较于嵌入模式、副驾驶模式,智能体模式的人机协同模式更为高效,或将成为未来人机协同的主要模式。
AI Agent行业综述——特征及分类
AI Agent的基本特征在于其自主性、交互性、反应性和适应性;在类别上,AI Agent目前可分为自主智能体(Autonomous Agent)和生成智能体(Generative Agent)。

智能体的基本特征在于其自主性、交互性、反应性和适应性,这些特征使得智能体能够在不同的环境中独立行动,与其他智能体或人类进行交互,对外部刺激做出反应,并根据经验调整自身的行为。在类别上,智能体目前可分为自主智能体(Autonomous Agent)和生成智能体(Generative Agent)。
AI Agent行业综述——市场规模
全球自主智能体市场规模预计从2019年的3.45亿美元增长至2024年的29.29亿美元。未来,大量的Agent会以软件助手的形态出现,同时原有软件形态的助手类产品也会升级迭代成自主智能体产品。
AI Agent行业综述——行业生态图谱


AI Agent行业综述——平台框架层厂商类型
中国AI Agent的发展处于早起阶段,不同类型的企业,如AIGC原生厂商、互联网巨头厂商、企服软件/SaaS厂商、RPA厂商、低代码/无代码厂商和3C硬件厂商,凭借其所处领域的独有优势进入AI Agent市场。

AI Agent行业综述——平台框架层厂商商业模式
AI Agent的商业模式包括软件及服务、Agent即服务、LLM即服务、Agent Store、消费者服务、企业解决方案、按需平台、数据和分析、技术许可等。
AI Agent行业综述——发展趋势
根据技术特性,学术界对于AI Agent的主流分类包括Logic Agent、Task Agent、Job Agent和自我演进Agent。目前国内外产品主要集中在Task Agent上,未来短期内Job Agent将快速发展。
学术界对于AI Agent的主流分类包括:1)Logic Agent,基于对输入语言、多模态的理解再次生成语言和多模态输出的一类Agent;2)Task Agent,面向具体任务,分解计划执行对应操作,过程中没有长期状态记忆的Agent;3)Job Agent,面向较为抽象的工作职责和总体目标,感知环境,记忆过程状态,自生子目标推动工作前进的Agent。
Task Agent涉及的非成熟技术相对较少,只有1项;Job Agent涉及到5项非成熟技术和1个疑难项;自我演进Agent涉及的关键技术基本全都是疑难项。目前,国内外主要AI Agent产品集中在Task Agent上,这种智能体涉及的技术较为成熟,容易复制推广,这类智能体数量将会快速增加。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。