凯捷研究院一项针对大型企业的调研显示,尽管使用人工智能自动化重复性业务任务能带来显著成本节约,但目前改进的任务相对简单。调研中相当数量的商业领袖表示,他们更倾向于专有AI实施方案而非开源替代品。
该调研涵盖1607名来自全球收入至少10亿美元企业的高管,结果显示商业领袖通过AI和生成式AI实现了客户运营成本40%的降幅。受访高管还实现了人员运营成本26%的削减、财务会计成本24%的降低,以及供应链和采购成本21%的减少。
作为行业中代理AI潜力的例证,凯捷突出介绍了塔可钟母公司百胜集团,该公司在全球运营6万家餐厅。公司引入AI驱动的餐厅管理系统来跟踪员工出勤、规划轮班模式,并根据市场条件建议调整营业时间。
虽然这些案例展现了AI和生成式AI提升商业效率的潜力,但研究发现受访者报告的收益很大一部分与自动化直接、重复性任务相关。凯捷认为,这表明受访高管对AI和生成式AI的使用代表早期阶段效率提升,而非长期变革性影响。
成本节约需要与运行AI系统的成本进行权衡。凯捷研究院指出,查询训练模型的价格正在急剧下降。例如,OpenAI的GPT 3.5从每百万令牌20美元降至0.07美元,而GPT-4在一年内从15美元降至0.12美元。
模型剪枝、量化和蒸馏等技术可用于减少AI模型的规模和复杂性。凯捷研究院指出,这些优化模型需要更少的计算资源,从而降低推理成本。除了更高效的算法外,凯捷研究院表示,高效的硬件利用、推理请求的批处理、基于当前需求动态调整计算资源的扩展,以及节能算法可以显著降低AI模型的功耗。
然而,尽管DeepSeek等开源模型已被证明能在不影响性能的情况下实现11倍的计算成本削减,并能解决许多组织面临的先进硬件瓶颈,但调研显示商业高管对开源AI的热情不如专有AI模型。
尽管开源AI模型在性能和成本方面的优势不断增加,凯捷报告称绝大多数高管仍继续偏爱专有AI实施方案。四分之三的受访高管偏好专有模型,其中43%选择超大规模云服务商开发的模型,另有三分之一选择小众供应商的模型。
凯捷发现,对专有模型和AI系统的偏好在那些已扩大AI和生成式AI投资的组织中尤为强烈。报告作者认为,这表明了一个明确趋势,即转向提供强大支持、安全性和集成能力的可信企业级AI产品。
发表在凯捷研究院《AI实践报告》中的研究结果,识别出了阻碍企业采用开源模型的一系列权衡因素,包括需要更强的技术专业知识、潜在的安全漏洞暴露,以及依赖社区驱动支持可能影响更新周期和文档质量。
凯捷商业服务首席执行官奥利弗·普费尔表示:"生成式AI和代理AI能够真正变革商业服务——实现从传统成本导向模型向AI赋能的价值和洞察驱动业务的转变。那些采用以数据和AI为核心的集成方法的企业,将能够实现真正互联、无摩擦的企业运营。"
不过,他指出研究表明组织在扩大AI代理部署时面临诸多障碍。"采用务实方法、培养对AI的信任并创建强大的数据基础,将在将商业服务转变为推动任何企业的战略动力方面发挥重要作用。"
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。