智能体AI正迎来全方位爆发的时刻,真的如此吗?
对于那些关注社交媒体动态、供应商声明以及充斥着夸张言论的思想领袖圈的IT从业者来说,他们很容易认为全球企业即将依靠AI智能体运营——这些软件可以自动化从代码生成到内容创作的各种任务,这是可以理解的。
他们看到有人宣称智能体劳动力时代已经到来(90%的IT支持工作将由智能体执行!),以及关于进取的程序员通过基于智能体的产品创造收益的轶事。与此同时,其他人则声称业界被兜售了一套虚假承诺,实际情况与炒作并不相符。
就像科技领域经常出现的情况一样,现实更为复杂。即便如此,数据能够说明问题。尽管麦肯锡调查显示39%的组织表示正在试验智能体,但只有23%已经开始在一个业务职能内扩展AI智能体。
AI智能体解释
首先,让我们退一步思考:AI智能体究竟是什么?为什么IT领导者对它们如此兴奋?
利用上下文理解以及从大语言模型和其他来源获得的数据,AI智能体能够感知并从其系统环境中学习,并在努力完成目标的过程中通过推理解决问题。
智能体还与其他智能体以及其他应用程序协作。它们就像工蜂一样,忙碌地工作以取悦蜂王。高效实现目标是最终目的。
用户可能会通过提供上下文来引导大语言模型产生期望的输出,而智能体则根据其编程的问题解决逻辑和训练数据,自主找出实现目标的方法。
Salesforce、Workday和微软等众多供应商已经开始将智能体嵌入企业用于客户服务和其他功能的应用程序中。
智能体为何处于快进与慢行并存的模式
然而,跨平台工作的多智能体系统的采用进展较为缓慢。那些试图依靠智能体运营业务的公司遭遇的高调失败,以及智能体经历灾难性技术故障的案例,都无济于事。
IDC高级研究总监Nancy Gohring表示,多智能体系统在技术上构建和操作都具有挑战性,供应商在弄清如何将智能体生成和消费的数据货币化的同时,对使这些系统互操作持谨慎态度。
Gohring说:"这既是技术问题,也是竞争局面。"她补充说,供应商希望将客户留在自己的生态系统内。例如,一个供应商的客户服务平台的API无法与另一个供应商的电子商务软件的API配合使用。
Cengage首席信息官Ken Grady同意供应商在寻求竞争和保护其数据护城河时目标相左的观点。他表示,这是很少有公司能够从智能体中获得真正价值的重要原因。
即使是开发人员也在智能体应用中遇到困难
危险和风险的双重幽灵甚至笼罩着软件开发领域。
尽管各种规模的组织都成功部署了智能体来自动化编码,但Voxel首席技术官Bryan O'Sullivan表示,数据外泄风险、供应商围墙花园以及快速累积的脆弱性削弱了智能体的前景。他说,这可能导致"一堆不可靠的垃圾,除了让你花很多钱之外什么也做不了"。
如果智能体功能即使只有一小部分不精确,就可能使整个流程脱轨,这可能解释了为什么IT部门往往处于智能体采用的前沿,而其他业务部门则持观望态度。因此,O'Sullivan表示,"智能体深入渗透到其他有价值领域"仍然有限。
一个问题根源于记忆——或者更确切地说,智能体缺乏记忆。为了实现自主操作的承诺,智能体必须能够访问长期、中期和短期记忆,这些对于从执行的任务中学习至关重要。如果没有这些能力,它们本质上就像大语言模型聊天会话;保质期很短。
乐观的理由
然而,人们坚信一旦AI行业找到解决这些挑战的方法——集体商业需求将推动它实现——智能体将自动化整个工作流程、完整流程,甚至可能是整个业务。
IT领导者可以将员工重新分配到更具战略性的任务,或者为创新找到新的杠杆。这是技术伟大梦想家们所追求的理想愿景,包括那些想象企业24小时运转、人类睡眠时几乎不受影响的人。
根据IDC的数据,至少在2026年,全球2000强企业中多达40%的工作岗位将涉及与AI智能体合作,这将重新定义许多企业的工作流程。
Cengage的Grady表示,他相信供应商将为自己和客户找到最佳前进道路。Grady预计,希望创建更高效业务流程的组织将扩大其智能体实施规模。
他说,例如,可能一直以2%运行的业务用例可能会随着技术和协议的成熟增长到20%,他补充说,更多公司将寻求将成功的试点项目投入生产。
与此同时,IT领导者应该做什么来为智能体企业做准备?
由于智能体代表一个新兴技术类别,目前还没有明确的采用手册。至少,没有专门针对智能体的手册。
即便如此,IDC的Gohring表示,IT领导者必须确定要运行和测试的试点项目。她补充说,随着他们对实验建立信心和舒适度,在寻求扩展之前,应该建立控制和可视性机制。
公司应该构建核心抽象层和基本编排,测试、学习,并寻求纳入治理和监控能力,特别是在扩展到数十个或更多智能体时。
根据实际使用模式完善架构至关重要。而且,一如既往,快速失败和学习是这个过程的关键部分。
Q&A
Q1:AI智能体是什么?它们如何工作?
A:AI智能体是能够自动化从代码生成到内容创作等各种任务的软件。它们利用大语言模型和其他来源的数据,能够感知并从系统环境中学习,通过推理解决问题来完成目标。与需要用户提示的大语言模型不同,智能体能够根据编程逻辑和训练数据自主找出实现目标的方法。
Q2:为什么多智能体系统的采用进展缓慢?
A:多智能体系统在技术上构建和操作具有挑战性。供应商在弄清如何将智能体数据货币化的同时,对系统互操作持谨慎态度,希望将客户留在自己的生态系统内。此外,不同供应商的API无法相互配合使用,数据外泄风险、供应商围墙花园以及系统脆弱性也削弱了智能体的应用前景。
Q3:IT领导者应该如何为智能体技术做准备?
A:IT领导者应该首先确定试点项目进行运行和测试,随着对实验建立信心,在扩展前建立控制和可视性机制。公司需要构建核心抽象层和基本编排,进行测试和学习,纳入治理和监控能力。根据实际使用模式完善架构至关重要,快速失败和学习是关键部分。目前智能体还是新兴技术,没有明确的采用手册。
好文章,需要你的鼓励
随着人工智能和高性能计算持续推动需求增长,数据中心设计正以同样惊人的速度演进。曾经的高密度机架已成为标准配置,冷却系统在数月而非数年内完成重新设计,项目在各地区的规模和复杂性不断提升。全球工程设计咨询公司Black & White Engineering指出,液冷成为标准配置、极端机架密度管理、工业化规模交付、电网约束下的电力创新、AI驱动运营设计以及可持续性成为核心设计原则,将成为2026年塑造数据中心设计、建设和运营的六大关键趋势。
这项由ByteDance Seed、香港科技大学等机构联合完成的研究提出了"轨迹场"这一创新的4D视频表示方法。研究团队开发的Trace Anything系统能够在单次前向传递中为视频中的每个像素预测连续的三维轨迹,无需光流估计或迭代优化。通过构建大规模合成数据平台和精心设计的训练方案,该方法在轨迹估计基准上实现了最先进性能,同时推理速度比竞争方法快10倍以上,并展现了运动预测、时空融合等多种涌现能力。
Snowflake本周推送的一次更新导致全球范围内的"重大故障",用户长达13小时无法查询数据、文件导入失败并收到错误信息。初步调查显示,最新版本引入了不向后兼容的数据库架构更新,导致版本不匹配错误。此次故障影响了全球23个区域中的10个,包括美国、欧洲和亚洲多个数据中心。这是Snowflake一周内第二次发生事故。
伊斯法罕大学研究团队通过分析Google Play商店21款AI教育应用的用户评论,发现作业辅导类应用获得超80%正面评价,而语言学习和管理系统类应用表现较差。用户赞赏AI工具的快速响应和个性化指导,但抱怨收费过高、准确性不稳定等问题。研究建议开发者关注自适应个性化,政策制定者建立相关规范,未来发展方向为混合AI-人类模型。