据 Dell Technologies 全球 AI 解决方案专家 Soo Mei May 表示,那些正在探索人工智能代理能力的组织必须为大幅增长的基础设施需求做好准备,这种需求将会超出现有生成式 AI 的要求。
在最近接受 Computer Weekly 采访时,Soo 指出,代理式 AI 的早期实现可能会是“简单直接的”,不需要使用强化学习,但若要将其应用扩展到多个业务职能,就必须投入超过当前仅支持单一职能代理式 AI 实验的生成式 AI 基础设施。
Soo 解释说:“对于生成式 AI,你只需输入 Token 并获取输出 Token;而对于代理式 AI,Token 的数量将会增加 20 到 30 倍,这就需要更多的计算能力。”
Soo 补充道,除了计算能力以外,对内存和存储的要求也会大幅提升。“在代理式 AI 中,你需要持久且长期的内存来存储所有过去的对话记录,因此存储需求将会非常庞大,而且你需要在未来三到五年内保留这些数据。”
这种增加的存储需求不仅仅是为了对话数据,还用于治理。“代理的自主性使得在整个系统中构建透明度和可解释性变得更加紧迫,”Soo 说道。“我们需要持续记录所有内容,这样才能解释为什么一个代理会得出某个结论,例如,这再次意味着存储需求会更高。”
对于网络基础设施而言,代理式 AI 系统通常涉及多个代理互相交互,并同时从内部和外部来源检索数据,这对网络也提出了重大挑战。Soo 表示:“延迟在这里无疑扮演着非常重要的角色。如果一个代理花费五分钟来查找信息,那是行不通的。因此,网络部分必须非常坚固。”
尽管许多组织——特别是金融服务、制造业和医疗保健领域的机构——已经构建了强大的内部部署或云端生成式 AI 能力,但代理式 AI 要将应用扩展到更多业务职能,仍需进一步投资,Soo 指出。
在支持代理式 AI 应用的大语言模型部署方面,Soo 表示,组织需要一款至少含有 700 亿参数的协调器模型,才能有效规划和调度 AI 代理并做出连贯决策。
她还补充说,针对狭窄、专注任务表现更优的小型语言模型,可以用于支持大语言模型,同时大语言模型还可以调用机器学习模型来处理特定的预测任务。
Dell 正在通过培训会、研讨会和概念验证项目,帮助客户和合作伙伴为向代理式 AI 的转变做好准备。但 Soo 认为,主要的挑战不在于技术技能差距,而在于组织如何运用代理式 AI以及对其本质的理解。
她说:“他们可能认为这只是一个大语言模型,但实际上很少有人知道这实际上是一个包含多项组件的系统——不仅仅是一个大语言模型;你还需要一个协调器、一个提示系统、持久记忆、工具调用以及与代理和用户的接口。但我相信他们的认知正在不断提高,因为他们正在花时间去深入了解它。”
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。