希望AI能够帮助节省成本并提高IT基础设施效率的技术领导者应该了解,只有28%的用例能够完全成功并提供投资回报。
根据Gartner的最新数据,IT基础设施和运营领域中,每五个AI项目中就有一个完全失败。
该机构对782名IT基础设施和运营管理人员进行的调研(于去年11月和12月进行)发现,57%的管理人员在其领域应用AI时至少经历过一次失败。
Gartner研究总监Melanie Freeze表示,许多AI项目失败是因为期望不切实际。
"他们认为AI会立即自动化复杂任务、降低成本或解决长期存在的运营问题,"她说,"当期望设定不现实且结果没有快速出现时,信心就会下降,项目就会停滞。"
"20%的失败率主要由过于雄心勃勃或范围界定不当的AI项目推动。不适合组织运营的AI根本无法带来投资回报。"
Gartner发现,IT基础设施和运营领导者最常在自动修复、自愈基础设施以及智能体主导的系统内部和系统间工作流管理方面观察到AI失败。
在面临挫折的IT基础设施和运营领导者中,38%的人表示持续的技能差距继续阻碍AI的成功。同样比例的受访者将数据质量差或数据可用性有限作为AI项目失败的直接原因。
研究发现,技术管理人员在技术更加成熟的领域更容易成功,比如将生成式AI应用于IT服务管理和云运营,53%的IT基础设施和运营领导者在这些领域报告了成功。
然而,在为技术基础设施中的AI应用获得资金支持方面存在挑战。Freeze说:"许多AI项目仍由各个业务部门单独资助。然而,随着AI基础设施支出持续上升,CEO和CFO需要在制定资助标准和批准重大投资方面发挥更积极的作用。"
这些发现出现在企业难以证明AI支出合理性的背景下。今年2月,一项针对美国、英国、德国和澳大利亚近6000名企业高管的调查发现,超过80%的受访者在就业或生产力方面没有察觉到AI的明显影响,尽管69%的企业目前使用某种形式的AI。
另一项由Dataiku委托Harris Poll进行的研究发现,技术领导者将在2026年面临展示AI投资回报的压力:98%的受访者表示董事会要求展示投资回报的压力越来越大,而71%接受调查的首席信息官认为,如果在上半年结束前没有达到目标,他们的AI预算可能会面临削减或冻结。
Q&A
Q1:AI基础设施项目的成功率有多高?
A:根据Gartner的调研数据显示,只有28%的AI基础设施项目能够完全成功并提供投资回报。每五个AI项目中就有一个完全失败,57%的IT基础设施和运营管理人员在应用AI时至少经历过一次失败。
Q2:为什么AI基础设施项目失败率这么高?
A:主要原因包括期望不切实际,认为AI会立即解决复杂问题;项目过于雄心勃勃或范围界定不当;持续的技能差距;以及数据质量差或数据可用性有限。38%的领导者将技能差距和数据质量问题作为失败的直接原因。
Q3:哪些AI应用领域相对更容易成功?
A:技术更加成熟的领域成功率更高,比如将生成式AI应用于IT服务管理和云运营,53%的IT基础设施和运营领导者在这些领域报告了成功。相比之下,自动修复、自愈基础设施等领域失败率较高。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。