
AI Agent行业综述——定义及基础架构
AI Agent(人工智能体)是一种能够感知环境、进行决策和执行动作的智能实体。不同于传统的人工智能,AI Agent具备通过独立思考、调用工具去逐步完成给定目标的能力。AI Agent和大模型的区别在于,大模型与人类之间的交互是基于prompt实现的,用户prompt是否清晰明确会影响大模型回答的效果。而AI Agent的工作仅需给定一个目标,它就能够针对目标独立思考并做出行动。
下载链接:
1、2024年中国AI Agent研究:创新驱动,智能技术革新
2、中国AI Agent行业研究:智能体落地千行百业,引领智能化革命的新引擎
AI Agent行业词条报告:驱动智能交互变革,重塑服务生态
1、面向办公自动化领域的 AI Agent 建设思考与分享
2、AI Agent 在企业经营分析场景的落地
3、LLM和Multi-Agent在运维领域的实验探索

一个基于大模型的AI Agent系统可以拆分为LLM(大模型)、记忆(Memory)、任务(Planning)以及工具使用(Tool)的集合。在LLM为基础的AI Agent系统中,大模型为AIAgent系统的大脑负责计算,并需要其他组件进行辅助。
AI Agent行业综述——人机协同模式差异
人类与AI协同的三种模式包括嵌入模式(Embedding)、副驾驶模式(Copilot)和智能体模式(Agent),相较于前两种模式,智能体模式更为高效,或将成为未来人机协同的主要模式。

基于大模型的Agent不仅可以让每个人都有增强能力的专属智能助理,还将改变人机协同的模式。带来更加广泛的人机融合。生成式AI带来的人机协同,将会呈现三种模式:嵌入模式(Embedding)、副驾驶模式(Copilot)和智能体模式(Agent)。相较于嵌入模式、副驾驶模式,智能体模式的人机协同模式更为高效,或将成为未来人机协同的主要模式。
AI Agent行业综述——特征及分类
AI Agent的基本特征在于其自主性、交互性、反应性和适应性;在类别上,AI Agent目前可分为自主智能体(Autonomous Agent)和生成智能体(Generative Agent)。

智能体的基本特征在于其自主性、交互性、反应性和适应性,这些特征使得智能体能够在不同的环境中独立行动,与其他智能体或人类进行交互,对外部刺激做出反应,并根据经验调整自身的行为。在类别上,智能体目前可分为自主智能体(Autonomous Agent)和生成智能体(Generative Agent)。
AI Agent行业综述——市场规模
全球自主智能体市场规模预计从2019年的3.45亿美元增长至2024年的29.29亿美元。未来,大量的Agent会以软件助手的形态出现,同时原有软件形态的助手类产品也会升级迭代成自主智能体产品。
AI Agent行业综述——行业生态图谱


AI Agent行业综述——平台框架层厂商类型
中国AI Agent的发展处于早起阶段,不同类型的企业,如AIGC原生厂商、互联网巨头厂商、企服软件/SaaS厂商、RPA厂商、低代码/无代码厂商和3C硬件厂商,凭借其所处领域的独有优势进入AI Agent市场。

AI Agent行业综述——平台框架层厂商商业模式
AI Agent的商业模式包括软件及服务、Agent即服务、LLM即服务、Agent Store、消费者服务、企业解决方案、按需平台、数据和分析、技术许可等。
AI Agent行业综述——发展趋势
根据技术特性,学术界对于AI Agent的主流分类包括Logic Agent、Task Agent、Job Agent和自我演进Agent。目前国内外产品主要集中在Task Agent上,未来短期内Job Agent将快速发展。
学术界对于AI Agent的主流分类包括:1)Logic Agent,基于对输入语言、多模态的理解再次生成语言和多模态输出的一类Agent;2)Task Agent,面向具体任务,分解计划执行对应操作,过程中没有长期状态记忆的Agent;3)Job Agent,面向较为抽象的工作职责和总体目标,感知环境,记忆过程状态,自生子目标推动工作前进的Agent。
Task Agent涉及的非成熟技术相对较少,只有1项;Job Agent涉及到5项非成熟技术和1个疑难项;自我演进Agent涉及的关键技术基本全都是疑难项。目前,国内外主要AI Agent产品集中在Task Agent上,这种智能体涉及的技术较为成熟,容易复制推广,这类智能体数量将会快速增加。
好文章,需要你的鼓励
美国连锁超市巨头Albertsons正在基于Databricks构建商品智能平台,整合产品、定价、促销与陈列等决策功能,目标是在2026年底前全面向门店运营商落地。该平台以Databricks Lakehouse存储零售数据,通过Unity Catalog与AI Gateway实现数据治理,并借助AI智能体Genie支持自然语言查询,帮助商家洞察销售趋势,提升决策效率。此举是Albertsons今年四项AI核心战略投资之一。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
微软正将Windows 11打造成真正的AI操作系统。在Build大会上,微软展示了AI模型与智能代理如何深度融合进Windows 11,让用户通过自然语言完成系统操作。借助Windows ML框架,超过5亿台PC已可在本地离线运行AI任务,无需联网、无token费用、数据不离设备。Office、Photos、Teams等应用已支持本地AI能力,Adobe、WhatsApp、Canva等第三方也在积极跟进,企业级AI PC采购需求有望加速。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。