
AI Agent行业综述——定义及基础架构
AI Agent(人工智能体)是一种能够感知环境、进行决策和执行动作的智能实体。不同于传统的人工智能,AI Agent具备通过独立思考、调用工具去逐步完成给定目标的能力。AI Agent和大模型的区别在于,大模型与人类之间的交互是基于prompt实现的,用户prompt是否清晰明确会影响大模型回答的效果。而AI Agent的工作仅需给定一个目标,它就能够针对目标独立思考并做出行动。
下载链接:
1、2024年中国AI Agent研究:创新驱动,智能技术革新
2、中国AI Agent行业研究:智能体落地千行百业,引领智能化革命的新引擎
AI Agent行业词条报告:驱动智能交互变革,重塑服务生态
1、面向办公自动化领域的 AI Agent 建设思考与分享
2、AI Agent 在企业经营分析场景的落地
3、LLM和Multi-Agent在运维领域的实验探索

一个基于大模型的AI Agent系统可以拆分为LLM(大模型)、记忆(Memory)、任务(Planning)以及工具使用(Tool)的集合。在LLM为基础的AI Agent系统中,大模型为AIAgent系统的大脑负责计算,并需要其他组件进行辅助。
AI Agent行业综述——人机协同模式差异
人类与AI协同的三种模式包括嵌入模式(Embedding)、副驾驶模式(Copilot)和智能体模式(Agent),相较于前两种模式,智能体模式更为高效,或将成为未来人机协同的主要模式。

基于大模型的Agent不仅可以让每个人都有增强能力的专属智能助理,还将改变人机协同的模式。带来更加广泛的人机融合。生成式AI带来的人机协同,将会呈现三种模式:嵌入模式(Embedding)、副驾驶模式(Copilot)和智能体模式(Agent)。相较于嵌入模式、副驾驶模式,智能体模式的人机协同模式更为高效,或将成为未来人机协同的主要模式。
AI Agent行业综述——特征及分类
AI Agent的基本特征在于其自主性、交互性、反应性和适应性;在类别上,AI Agent目前可分为自主智能体(Autonomous Agent)和生成智能体(Generative Agent)。

智能体的基本特征在于其自主性、交互性、反应性和适应性,这些特征使得智能体能够在不同的环境中独立行动,与其他智能体或人类进行交互,对外部刺激做出反应,并根据经验调整自身的行为。在类别上,智能体目前可分为自主智能体(Autonomous Agent)和生成智能体(Generative Agent)。
AI Agent行业综述——市场规模
全球自主智能体市场规模预计从2019年的3.45亿美元增长至2024年的29.29亿美元。未来,大量的Agent会以软件助手的形态出现,同时原有软件形态的助手类产品也会升级迭代成自主智能体产品。
AI Agent行业综述——行业生态图谱


AI Agent行业综述——平台框架层厂商类型
中国AI Agent的发展处于早起阶段,不同类型的企业,如AIGC原生厂商、互联网巨头厂商、企服软件/SaaS厂商、RPA厂商、低代码/无代码厂商和3C硬件厂商,凭借其所处领域的独有优势进入AI Agent市场。

AI Agent行业综述——平台框架层厂商商业模式
AI Agent的商业模式包括软件及服务、Agent即服务、LLM即服务、Agent Store、消费者服务、企业解决方案、按需平台、数据和分析、技术许可等。
AI Agent行业综述——发展趋势
根据技术特性,学术界对于AI Agent的主流分类包括Logic Agent、Task Agent、Job Agent和自我演进Agent。目前国内外产品主要集中在Task Agent上,未来短期内Job Agent将快速发展。
学术界对于AI Agent的主流分类包括:1)Logic Agent,基于对输入语言、多模态的理解再次生成语言和多模态输出的一类Agent;2)Task Agent,面向具体任务,分解计划执行对应操作,过程中没有长期状态记忆的Agent;3)Job Agent,面向较为抽象的工作职责和总体目标,感知环境,记忆过程状态,自生子目标推动工作前进的Agent。
Task Agent涉及的非成熟技术相对较少,只有1项;Job Agent涉及到5项非成熟技术和1个疑难项;自我演进Agent涉及的关键技术基本全都是疑难项。目前,国内外主要AI Agent产品集中在Task Agent上,这种智能体涉及的技术较为成熟,容易复制推广,这类智能体数量将会快速增加。
好文章,需要你的鼓励
研究人员基于Meta前首席AI科学家Yann LeCun提出的联合嵌入预测架构,开发了名为JETS的自监督时间序列基础模型。该模型能够处理不规则的可穿戴设备数据,通过学习预测缺失数据的含义而非数据本身,成功检测多种疾病。在高血压检测中AUROC达86.8%,心房扑动检测达70.5%。研究显示即使只有15%的参与者有标注医疗记录,该模型仍能有效利用85%的未标注数据进行训练,为利用不完整健康数据提供了新思路。
西湖大学等机构联合发布TwinFlow技术,通过创新的"双轨道"设计实现AI图像生成的革命性突破。该技术让原本需要40-100步的图像生成过程缩短到仅需1步,速度提升100倍且质量几乎无损。TwinFlow采用自我对抗机制,无需额外辅助模型,成功应用于200亿参数超大模型,在GenEval等标准测试中表现卓越,为实时AI图像生成应用开辟了广阔前景。
AI云基础设施提供商Coreweave今年经历了起伏。3月份IPO未达预期,10月收购Core Scientific计划因股东反对而搁浅。CEO Michael Intrator为公司表现辩护,称正在创建云计算新商业模式。面对股价波动和高负债质疑,他表示这是颠覆性创新的必然过程。公司从加密货币挖矿转型为AI基础设施提供商,与微软、OpenAI等巨头合作。对于AI行业循环投资批评,Intrator认为这是应对供需剧变的合作方式。
中山大学等机构联合开发的RealGen框架成功解决了AI生成图像的"塑料感"问题。该技术通过"探测器奖励"机制,让AI在躲避图像检测器识别的过程中学会制作更逼真照片。实验显示,RealGen在逼真度评测中大幅领先现有模型,在与真实照片对比中胜率接近50%,为AI图像生成技术带来重要突破。