AI Agent行业综述——定义及基础架构
AI Agent(人工智能体)是一种能够感知环境、进行决策和执行动作的智能实体。不同于传统的人工智能,AI Agent具备通过独立思考、调用工具去逐步完成给定目标的能力。AI Agent和大模型的区别在于,大模型与人类之间的交互是基于prompt实现的,用户prompt是否清晰明确会影响大模型回答的效果。而AI Agent的工作仅需给定一个目标,它就能够针对目标独立思考并做出行动。
下载链接:
1、2024年中国AI Agent研究:创新驱动,智能技术革新
2、中国AI Agent行业研究:智能体落地千行百业,引领智能化革命的新引擎
AI Agent行业词条报告:驱动智能交互变革,重塑服务生态
1、面向办公自动化领域的 AI Agent 建设思考与分享
2、AI Agent 在企业经营分析场景的落地
3、LLM和Multi-Agent在运维领域的实验探索
一个基于大模型的AI Agent系统可以拆分为LLM(大模型)、记忆(Memory)、任务(Planning)以及工具使用(Tool)的集合。在LLM为基础的AI Agent系统中,大模型为AIAgent系统的大脑负责计算,并需要其他组件进行辅助。
AI Agent行业综述——人机协同模式差异
人类与AI协同的三种模式包括嵌入模式(Embedding)、副驾驶模式(Copilot)和智能体模式(Agent),相较于前两种模式,智能体模式更为高效,或将成为未来人机协同的主要模式。
基于大模型的Agent不仅可以让每个人都有增强能力的专属智能助理,还将改变人机协同的模式。带来更加广泛的人机融合。生成式AI带来的人机协同,将会呈现三种模式:嵌入模式(Embedding)、副驾驶模式(Copilot)和智能体模式(Agent)。相较于嵌入模式、副驾驶模式,智能体模式的人机协同模式更为高效,或将成为未来人机协同的主要模式。
AI Agent行业综述——特征及分类
AI Agent的基本特征在于其自主性、交互性、反应性和适应性;在类别上,AI Agent目前可分为自主智能体(Autonomous Agent)和生成智能体(Generative Agent)。
智能体的基本特征在于其自主性、交互性、反应性和适应性,这些特征使得智能体能够在不同的环境中独立行动,与其他智能体或人类进行交互,对外部刺激做出反应,并根据经验调整自身的行为。在类别上,智能体目前可分为自主智能体(Autonomous Agent)和生成智能体(Generative Agent)。
AI Agent行业综述——市场规模
全球自主智能体市场规模预计从2019年的3.45亿美元增长至2024年的29.29亿美元。未来,大量的Agent会以软件助手的形态出现,同时原有软件形态的助手类产品也会升级迭代成自主智能体产品。
AI Agent行业综述——行业生态图谱
AI Agent行业综述——平台框架层厂商类型
中国AI Agent的发展处于早起阶段,不同类型的企业,如AIGC原生厂商、互联网巨头厂商、企服软件/SaaS厂商、RPA厂商、低代码/无代码厂商和3C硬件厂商,凭借其所处领域的独有优势进入AI Agent市场。
AI Agent行业综述——平台框架层厂商商业模式
AI Agent的商业模式包括软件及服务、Agent即服务、LLM即服务、Agent Store、消费者服务、企业解决方案、按需平台、数据和分析、技术许可等。
AI Agent行业综述——发展趋势
根据技术特性,学术界对于AI Agent的主流分类包括Logic Agent、Task Agent、Job Agent和自我演进Agent。目前国内外产品主要集中在Task Agent上,未来短期内Job Agent将快速发展。
学术界对于AI Agent的主流分类包括:1)Logic Agent,基于对输入语言、多模态的理解再次生成语言和多模态输出的一类Agent;2)Task Agent,面向具体任务,分解计划执行对应操作,过程中没有长期状态记忆的Agent;3)Job Agent,面向较为抽象的工作职责和总体目标,感知环境,记忆过程状态,自生子目标推动工作前进的Agent。
Task Agent涉及的非成熟技术相对较少,只有1项;Job Agent涉及到5项非成熟技术和1个疑难项;自我演进Agent涉及的关键技术基本全都是疑难项。目前,国内外主要AI Agent产品集中在Task Agent上,这种智能体涉及的技术较为成熟,容易复制推广,这类智能体数量将会快速增加。
好文章,需要你的鼓励
知名的投资机构ICONIQ Capital发布了《开发者手册:2025年AI现状报告》,基于对300位企业高管的调研,包括CEO、工程负责人、AI负责人和产品负责人等关键决策者,涵盖了从初创公司到十亿美元巨头的各个发展阶段,深度剖析了当下企业AI产品应用的全貌,为我们呈现了一个从"如何构思、交付和规模化AI驱动业务"的完整路线。
中科大团队开发出LongAnimation系统,解决了长动画自动上色中的色彩一致性难题。该系统采用动态全局-局部记忆机制,能够为平均500帧的动画进行稳定上色,性能比现有方法提升35-58%。核心创新包括SketchDiT特征提取器、智能记忆模块和色彩优化机制,可大幅提升动画制作效率。
南开大学团队开发出DepthAnything-AC模型,解决了现有AI距离估算系统在恶劣天气和复杂光照条件下性能下降的问题。通过创新的扰动一致性训练框架和空间距离约束机制,该模型仅用54万张图片就实现了在雨雪、雾霾、夜晚等复杂环境下的稳定距离判断,同时保持正常条件下的优秀性能,为自动驾驶和机器人导航等应用提供了重要技术支撑。