由贝恩咨询公司于周四发布的一份报告指出,以智能体为主导的软件开发正从根本上重塑工程行业,但部分技术团队尚未充分释放AI所能带来的生产力潜能。该报告基于这家管理咨询公司在2025年至2026年间开展的全球高管调查及市场研究。
受访者表示,预计到今年秋季,将有超过一半的工程工作将借助智能体完成;而到2027年春季,这一比例将进一步攀升至约90%。尽管受访者反映,AI使每位工程师的产出提升了63%,但大多数企业表示,在摸索AI输出成果的管理新模式过程中,整体效率尚未实现足够显著的提升。
贝恩咨询公司合伙人、该报告联合作者Purna Doddapaneni指出,企业若要真正从中获益,技术团队在引入AI智能体时,需要对工程运营的各个层级进行系统性调整,而不能仅仅将智能体嵌入代码生成或测试等单一环节。"在智能体主导的世界里,工作由智能体来完成,"他说,"而作为人类或组织,我们需要对智能体所做的决策承担责任。"
Doddapaneni表示,智能体的作用已不再局限于小幅提升开发者效率,而是正在重构整个工程交付体系。
软件平台Harness上月发布的《2026年工程卓越现状》报告同样指出,将AI融入工程工作流程已成为行业默认选择。这项技术改变了工程团队的工作方式和生产力衡量标准——工程师们在代码审查、漏洞修复以及工具间的上下文切换上花费了更多时间。
然而,Doddapaneni强调,若团队未能围绕持续演进的工具调整运营方式,便无法真正从中受益。报告建议,在AI辅助工作流中,人类应扮演战略顾问和事故响应者的角色。产品与工程团队可能将普遍采用混合智能体模式,开发者的角色也将从代码编写者逐步转变为智能体协调者。
Doddapaneni指出,更强大的AI模型本身并不能自动创造价值,还需要建立相应的流程,引导其朝着企业目标和战略方向运行。
"模型就像一台发动机,光有一台更强劲的引擎并不能帮我开车——我还需要考虑方向盘、刹车以及周围的一切,"他说,"这就好比我在发动机(即模型)外面搭建了一套驾驶框架,为它提供上下文信息,让它带我从一个地方到达另一个地方。"
大多数工程流程都涵盖两个维度:其一是产品开发生命周期,即依据客户需求、市场机会和战略路线图来界定构建目标;其二是软件开发生命周期,即通过编码、测试和部署来完成产品构建。
Doddapaneni表示,随着人类在产品开发和代码编写上投入的时间不断减少,转而专注于管理AI输出,开发工作线性推进的传统模式正在AI时代逐渐消解。他将此称为"技术脚手架"——即为AI搭建护栏和指引规则,确保其产出符合预期目标。
"那些在没有系统性重新设计的情况下仍在推进试点项目的CIO,终将遭遇瓶颈,"他说。
Q&A
Q1:贝恩咨询报告对AI智能体辅助工程工作的预测是什么?
A:根据贝恩咨询公司发布的报告,受访者预计到2025年秋季,将有超过一半的工程工作由AI智能体协助完成;到2027年春季,这一比例将上升至约90%。同时,AI已使每位工程师的产出提高了63%,但多数企业尚未在整体效率上看到大幅提升,原因在于新的管理模式尚在探索中。
Q2:工程师在AI智能体主导的工作模式下,角色会发生哪些变化?
A:在AI智能体主导的工作模式下,工程师的角色将从传统的代码编写者转变为智能体协调者,同时承担战略顾问和事故响应者的职责。团队需要对工程运营的各个层级进行系统调整,而非仅将智能体嵌入单一任务环节,才能真正释放AI带来的生产力价值。
Q3:企业如何避免在引入AI过程中遭遇效率瓶颈?
A:Doddapaneni建议,企业需要围绕AI工具进行系统性的运营重设计,包括建立"技术脚手架",即为AI设置护栏和指引规则,以确保其输出符合企业目标。仅靠引入更强大的AI模型而不调整配套流程,无法真正发挥其价值。CIO若在缺乏系统重设计的情况下仍停留在试点阶段,最终将面临效率天花板。
好文章,需要你的鼓励
机器人智能公司Inbolt将于2026年6月在芝加哥Automate展会上发布两项新能力:Inbolt机器人编程功能和扩展版机器人控制模块。新功能可让工程师直接基于CAD模型构建程序,结合视觉模型实时定位实体零件并自动调整运动路径,彻底消除传统调试中耗时数周的手动示教环节。此次更新还将原生支持安川机器人,使平台覆盖品牌扩展至六个。
马里兰大学提出无需训练奖励模型的数学推理方案,用大模型实时为小模型的分块生成过程打分选优,效果媲美专用过程奖励模型。
本文提供了一套完整的笔记本电脑深度清洁方案。硬件方面,介绍了如何用温和洗涤剂清洁机身、用微纤维布擦拭屏幕、用压缩空气清理键盘及清洁充电线的正确方法。软件方面,建议及时更新操作系统与驱动程序,删除冗余文件与临时下载内容,并通过开启Windows Storage Sense功能实现自动清理,同时将剩余文件整理归类,保持系统整洁高效运行。
上交大等机构联合构建首个个性化MCP工具测评平台,测试超十款顶尖AI在飞书、小红书等真实个人账号场景的实际能力,结果显示无一模型准确率超过50%。