AI技术的快速迭代正在成为企业面临的重大挑战,企业发现自己需要不断重构AI基础设施,以应对不断发展的AI能力和变化的AI策略。
根据AI数据质量供应商Cleanlab的一项调查,70%的受监管企业和41%的非监管企业每三个月至少更换部分AI技术栈,另有四分之一的受监管和非监管公司每六个月进行更新。
这项调查涵盖了1800多名软件工程领导者,凸显了组织在跟上不断变化的AI领域和将智能体部署到生产环境中时仍面临困难。Cleanlab首席执行官Curtis Northcutt表示,调查结果表明企业在这两方面都存在挑战。
智能体部署现状令人担忧
调查显示,仅有5%的受访者拥有生产环境中的智能体或计划很快将其投入生产。基于受访工程师对技术挑战的回答,Cleanlab估计只有1%的代表性企业已将智能体部署到试点阶段之外。
"企业智能体根本没有到位,它们远未达到人们所说的水平,"Northcutt说道。"实际上有数百家初创公司试图为企业销售智能体组件,但都失败了。"
即使没有达到完全的生产状态,许多组织每隔几个月就重建其智能体技术栈组件的事实不仅证明了AI领域变化的速度,也表明了对智能体结果缺乏信心。
智能体技术栈的变化范围从简单的底层AI模型版本更新,到从闭源模型迁移到开源模型,或改变存储智能体数据的数据库。在许多情况下,更换栈中的一个组件会引发下游的连锁变化。
语音AI提供商Cozmo AI的联合创始人兼首席技术官Nuha Hashem也观察到智能体技术栈频繁变化的模式。她表示,Cleanlab的调查结果与Cozmo在受监管环境中看到的变动情况相符。
"许多客户团队每季度都会更换栈的部分组件,因为早期设置往往是一个拼凑而成的系统,在测试中表现为一种方式,在生产中却表现为另一种方式,"她补充说。"库或路由规则的小变化都可能改变智能体处理任务的方式,这会强制进行另一次重建。"
技术演进带来的挑战
虽然AI演进的速度可能推动频繁的重建,但问题的一部分在于AI模型的调整方式。Hashem解释说:"更深层的问题是许多智能体系统依赖于模型内部的行为,而不是清晰的规则。当模型更新时,行为会发生偏移。当团队为智能体设置清晰的步骤和检查时,栈可以在不断破坏的情况下演进。"
另一个问题似乎是对AI栈现有组件的满意度较低。Cleanlab调查询问了用户对智能体基础设施几个组件的体验,包括智能体编排、快速推理和可观测性。在列出的五个组件中,只有约三分之一的受访者表示对其中任何一个感到满意,约40%的人表示正在寻找每个组件的替代方案。
只有28%的受访者对他们现有的智能体安全和防护措施感到满意,这表明对智能体结果缺乏信任。
行业专家的观点
虽然Cleanlab的调查可能描绘了智能体当前状态的暗淡图景,但几位AI专家表示其结论似乎是准确的。
基于AI的客户体验提供商Laivly的首席执行官Jeff Fettes对许多企业每隔几个月重建部分智能体栈并不感到惊讶。他看到了类似的现象。
"在AI方面更成功的组织的区别在于他们的迭代能力,"他说。"你在那里看到的是公司没有放弃旧的做事方式,他们真的很难跟上AI技术本身演进的速度。"
对于大多数其他主要IT平台,首席信息官会经历漫长的评估和部署过程,但AI进步的速度已经破坏了这个时间表。Fettes说:"IT部门过去会经历大的规划弧线,然后转换他们的技术栈,这会在一段时间内保持良好状态。现在,他们发现自己走了一半——或者刚走了一小段——规划过程,技术已经发展得如此之远,他们必须重新开始。"
Fettes看到许多客户随着技术的发展而放弃AI试点项目。"这创造了一种情况,许多公司必须放弃现有的用例,"他说。"我们知道我们正在很短的时间内淘汰我们自己的技术。"
应对策略和建议
应用开发公司Tapforce的联合创始人兼首席技术官Artur Balabanskyy表示,该公司也看到企业每隔几个月重建其AI栈,这是由持续演进推动的。
"现在有效的东西以后可能会变得次优,"他说。"如果组织不积极跟上时代并刷新他们的栈,他们就有在性能、安全性和可靠性方面落后的风险。"
然而,Balabanskyy补充说,持续的重建不必创造混乱。他建议首席信息官对其智能体栈采取分层方法,包括强大的版本控制、持续监控和模块化部署方法。
"模块化架构允许领导者在必要时破坏完整栈以及更换组件,"他说。"防护措施、自动化测试和可观测性对于确保生产系统即使在技术演进时也保持可靠都是至关重要的。"
Cleanlab的Northcutt建议IT领导者在部署前经历一个严格的过程,包括详细描述智能体预期要做什么的先决条件。
"人们会说,'让AI做客户支持',这是一个非常高层次的事情,"他说。"第一步是,'让我们非常精确地定义,AI从哪里开始?我们期望良好的性能是什么样子?我们期望它完成什么?它实际上要使用什么工具?'"
调查结果表明,智能体的广泛部署可能仍需数年时间。Northcutt预测,估计1%拥有生产环境智能体的组织将在2027年上升到3%或4%,真正的生产智能体将在2030年达到30%的企业。
他相信智能体将带来重大好处,但他敦促支持者在此期间减少他们的夸大言论。"我们现在可以使用AI来提高我们的工作,但企业AI自动化一切和每个产品中都有智能体的整个想法,它正在到来,"他说。"如果我们能保持冷静,设定合理的期望,那么所有投资的资金可能真正发挥作用。"
Q&A
Q1:为什么企业需要频繁重构AI技术栈?
A:主要原因是AI技术演进速度极快,企业需要不断适应新的AI能力和变化的策略。调查显示70%的受监管企业每三个月至少更换部分AI技术栈,这反映了AI领域变化的速度和企业对智能体结果缺乏信心。
Q2:企业智能体的部署情况如何?
A:目前企业智能体部署状况不理想。调查显示仅有5%的受访者在生产环境中拥有智能体或计划很快部署,估计只有1%的企业已将智能体部署超出试点阶段,预计2030年才能达到30%的企业真正部署。
Q3:如何减少AI技术栈频繁重建带来的混乱?
A:专家建议采用分层方法,包括强大的版本控制、持续监控和模块化部署。模块化架构允许在必要时更换组件而不破坏整个系统,同时需要建立防护措施、自动化测试和可观测性来确保系统可靠性。
好文章,需要你的鼓励
Linux基金会宣布成立代理AI基金会,为AI智能体基础设施开发提供厂商中立的监督。尽管业界承认AI智能体存在安全问题,高德纳咨询公司警告许多企业项目可能因缺乏商业价值而被取消,但基金会仍致力于为AI公司提供中立平台。Anthropic、Block和OpenAI分别贡献了三个项目,包括模型上下文协议、开源AI智能体框架和机器可读文档标准。
快手科技研究团队提出了熵比截断机制,用于解决强化学习训练中AI容易"走偏"的问题。该方法通过监控AI学习前后思维活跃度变化,在关键时刻进行精准干预,既保证训练稳定性又维持探索能力。在数学推理任务中,此方法显著提升了模型性能并改善了训练稳定性,为AI训练领域提供了新的解决思路。
微软计划在未来四年内向印度投资175亿美元,这是该公司在亚洲的最大投资。投资将用于建设新数据中心、AI基础设施和技能培训项目。此举正值全球科技巨头加速在印度布局,该国庞大的互联网和智能手机用户群体使其成为关键战场。投资还包括在海德拉巴建设新数据中心区域,并与印度政府合作将AI能力整合到公共数字平台中。
EditThinker是北京航空航天大学与美团等机构联合研发的图像编辑AI框架,让AI在编辑图片时能够像人类一样进行反复思考和优化。该系统通过"批评-优化-重试"的循环机制,将传统的一次性编辑转变为迭代改进过程,在四个权威测试平台上显著提升了现有编辑模型的表现,特别是在需要复杂推理的编辑任务中效果突出。