研究显示,这一趋势在英国最为显著,66% 的公司表示已经部署了 AI 代理,而美国则相对落后,比例为 48%。
AI 代理是一种专门的完全自主的 AI,可以为企业加速特定工作流程。它们可以帮助安排工作时间,甚至进行战略评估并提出行动方案。最近,这项技术在科技领域备受关注,各大公司都在争分夺秒地推出自己的版本。
科技巨头 Amazon 于周一推出了 Nova Act,这是一个早期阶段的 AI 代理,可以帮助用户在网站上执行任务。OpenAI 则在今年一月发布了类似的 AI 代理 Operator 研究预览版。
就在上个月,Meta 商业 AI 负责人 Clara Shih 在接受 CNBC 采访时表示,她预计"从大到小的每个企业"很快都将拥有 AI 代理。
PagerDuty 首席信息官 Eric Johnson 在发布研究结果的新闻稿中表示:"PagerDuty 最新的调查数据显示,62% 的受访者预计代理式 AI 将带来三位数的投资回报率,这充分说明组织机构非常看好代理式 AI 在 AI 和自动化方面创造的实际价值。"
调查发现,美国公司预期获得最高回报率,达到初始投资的近两倍,即 192%。
公司普遍预期 AI 代理能够加速或完全自动化至少四分之一的公司工作量。但在比较代理式 AI 与现有生成式 AI 技术的潜力时,企业领导者意见不一。44% 认为代理式 AI 的影响力将超过生成式 AI,40% 则支持生成式 AI。16% 的受访者认为两种技术的影响力相当。
虽然这两种技术都主要依赖大语言模型,但生成式 AI 主要专注于根据人类提示创建文本、图像或视频等内容,而代理式 AI 则是自主的,更具主动性而非被动性。
去年底,Salesforce CEO Marc Benioff 宣称我们正在进入一个"代理时代",自主 AI 代理将颠覆职场。但一些分析师,如高盛全球股票研究主管 Jim Covello 则持更谨慎态度,认为对代理式 AI 的昂贵投资可能只会带来适度回报。
根据调查,目前采用生成式 AI 的公司数量多于采用代理式 AI 的公司,63% 表示已完全整合生成式 AI,另有 24% 表示已部署但尚未完全整合到运营中。
公司高管指出了在采用生成式 AI 时的一些错误,他们希望在整合 AI 代理时能够避免这些问题。特别是,许多人认为他们的公司在没有充分规划的情况下就匆忙采用,或最终在技术上投入过多。
代理式 AI 的前景也并非一片光明。许多受访者对采用该技术的实际风险表示担忧。主要担忧之一是安全问题。公司越是让代理式 AI 系统接触敏感公司数据,这些数据就越容易受到安全漏洞和针对 AI 的网络攻击的威胁。
企业高管还担心不断演变的 AI 监管和隐私法律可能在未来危及公司运营,糟糕的数据输入可能导致输出质量下降,以及 AI 幻觉——随着技术继续发展,虚假或无意义的输出仍然困扰着 AI。
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
莫斯科高等经济学院研究员尼古拉·斯克里普科开发了IFEval-FC基准测试,专门评估大语言模型在函数调用中遵循格式指令的能力。研究发现,即使是GPT-5和Claude Opus 4.1等最先进模型,在处理看似简单的格式要求时准确率也不超过80%,揭示了AI在实际应用中的重要局限性。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室联合多家机构推出MinerU2.5文档解析模型,仅用12亿参数就在文本、公式、表格识别等任务上全面超越GPT-4o等大型模型。该模型采用创新的两阶段解析策略,先进行全局布局分析再做局部精细识别,计算效率提升一个数量级。通过重新定义任务标准和构建高质量数据引擎,MinerU2.5能准确处理旋转表格、复杂公式、多语言文档等挑战性内容,为文档数字化提供了高效解决方案。