Gartner周二发布的一项研究结果显示,在基础设施与运营(I&O)领域,仅有28%的AI应用场景能够完全成功并达到预期投资回报率(ROI),而有高达20%的项目以彻底失败告终。
Gartner研究总监Melanie Freeze表示,项目失败"最常见的原因"包括对AI工具能力抱有不切实际的期望,以及在实际试点阶段存在技能缺口。
尽管上述结果已优于麻省理工学院去年发布的令人担忧的研究数据(该研究显示95%的生成式AI项目未能产生可量化的财务回报),但Freeze在接受CIO.com采访时表示,当前IT部门之间存在大量的探索性实验,许多I&O专业人员团队会"走出去尝试一些东西"。
Freeze指出,要实现预期的投资回报,IT部门绝不能将AI项目作为副业来运营。
在Gartner针对去年年底开展的783名I&O领导者调查所发布的问答简报中,Freeze表示,在57%报告至少一次失败经历的I&O领导者中,"许多人表示他们的AI项目失败是因为期望过高、节奏过快。他们认为AI会立即自动化复杂任务、削减成本或解决长期存在的运营问题。当预期目标设定不够务实,结果又迟迟未能显现时,信心便开始下滑,项目也随之陷入停滞。"
该调查还揭示,AI带来的投资回报并非取决于模型的复杂程度,而是取决于技术与实际运营需求的整合程度、治理水平以及契合度。
Gartner表示,已识别出三项关键成功因素:
其一,将AI嵌入人们日常使用的系统与流程中。Gartner指出,"当AI成为日常运营的组成部分,将有助于提升采用率,并在组织内部产生显而易见的影响。"
其二,成功的I&O高管能够获得来自高层领导的全力支持,这有助于"扫清障碍、协调优先事项,并确保投资持续获得资金支持和方向聚焦";
其三,构建切实可行的商业论证。
Freeze表示,I&O领导者应优先考量AI应用场景,并通过"将AI应用场景作为产品来管理"的方式确定资金分配,以避免重复投入、发挥协同效应,并跟踪AI对I&O及业务成果的整体影响。
她进一步说道:"在此基础上,I&O领导者可与CIO、数据与分析、安全、法务及财务等相关负责人协同合作,从可行性、风险、成本及预期业务影响等维度对各应用场景进行评估。采用统一的评分模型,便于对所有应用场景进行比较和排序,从而为投资决策提供参考依据。"
Freeze还指出,成功案例大多集中在生成式AI应用于特定领域的场景,尤其是IT服务管理(ITSM)和云运营,"这两个市场已较为成熟,且已验证了其业务价值。事实上,53%的I&O领导者表示他们的AI成果出现在ITSM领域。无论这些成果是在云端还是在ITSM中取得的,I&O领导者都必须确保这些成果在组织内广泛共享,并保持AI战略的整体一致性和集中领导。"
Freeze告诉CIO.com,在没有明确计划的情况下贸然启动项目,从来都不是明智之举:"对于任何技术而言,'我们开发了它,它就一定会成功',这种想法永远是危险的。一切都必须以商业论证为基础——你的业务需要什么?他们的目标是什么?在你现有的工具集无法解决的问题中,哪些是你职能范围内需要攻克的?在这套前期战略框架之下,成功才会随之而来。"
此外,失败的AI项目还可能波及整个组织。Freeze表示,无法提供安全、可靠、高可用的基础设施,可能对业务成果产生重大影响。
"失败的驱动因素与成功的驱动因素略有不同,"她说,"I&O领导者必须牢记,一个清晰定义、获得中央认可的AI项目组合,有助于组织将资源集中在最关键的地方。最重要的是,决定AI真实投资回报的,不仅仅是优先级的排序,更在于强有力的执行和业务层面的实际落地。"
Freeze补充道,一旦优先事项明确,便可进一步确定哪些应用场景值得获得资金支持,以及支持力度的大小。"目前,许多AI项目仍由各独立业务部门分别出资,"她指出,"然而,随着AI基础设施支出的持续攀升,CEO和CFO需要在制定资金标准和审批重大投资方面发挥更加积极主动的作用。"
Q&A
Q1:为什么企业IT部门的AI项目失败率这么高?
A:根据Gartner的研究,AI项目失败最常见的原因是对AI工具能力抱有不切实际的期望,以及在试点阶段存在技能缺口。许多I&O领导者期望AI能立刻自动化复杂任务、降低成本或解决长期运营问题,当结果未能快速显现时,信心下滑,项目随之停滞。此外,将AI项目作为"副业"运营,而非纳入核心战略,也是导致失败的重要因素。
Q2:哪些领域的AI应用成功率最高?
A:根据Gartner调查,生成式AI在IT服务管理(ITSM)和云运营领域的成功率最高,这两个市场相对成熟且已验证了实际业务价值。数据显示,53%的I&O领导者表示他们的AI成果集中出现在ITSM领域。Gartner建议,这些成功经验应在组织内部广泛共享,同时保持AI战略的整体一致性与集中领导。
Q3:企业如何提升AI项目的投资回报率?
A:Gartner总结了三项关键成功因素:一是将AI嵌入日常使用的系统与流程中,提升采用率;二是获得高层管理者的全力支持,确保资源持续投入;三是构建切实可行的商业论证,明确业务需求与预期目标。此外,建议以"产品化"方式管理AI应用场景,并联合CIO、安全、法务、财务等多方进行可行性与风险评估。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。