根据Sonar公司最新发布的开发者现状调查报告显示,尽管96%的软件开发者认为AI生成的代码在功能上不够准确,但只有48%的开发者表示会在提交前始终检查AI辅助生成的代码。
这项基于全球1100多名开发者的调查发现,AI编程工具已成为常态,72%使用过这些工具的开发者每天或一天多次使用它们。只有6%的开发者偶尔使用,即每周使用不到一次。
开发者表示,他们42%的代码包含AI模型的重要辅助,预计到2027年这一比例将达到65%,而2023年这一数字仅为6%。
开发者使用AI工具的软件项目类型广泛,包括原型开发(88%)、内部生产软件(83%)、面向客户的生产软件(73%)以及关键业务服务的生产软件(58%)。
最常用的编程工具包括:GitHub Copilot(75%)、ChatGPT(74%)、Claude/Claude Code(48%)、Gemini/Duet AI(37%)、Cursor(31%)等。
验证瓶颈问题凸显
随着AI工具使用量的增长,Sonar指出这创造了一个验证瓶颈。报告称:"这个验证步骤并非微不足道。虽然AI本应节省时间,但开发者正将大量节省的时间用于审查。几乎所有开发者(95%)都要花费一定精力审查、测试和纠正AI输出。大多数人(59%)认为这种努力是'适度'或'重大'的。"
调查显示,38%的受访者表示审查AI生成的代码比审查人类生成的代码需要更多努力,而27%的人持相反观点。
Sonar首席执行官塔里克·肖卡特表示:"我们正在见证软件工程的根本转变,价值不再由编写代码的速度定义,而是由部署代码的信心定义。虽然AI使代码生成变得几乎毫不费力,但它在输出和部署之间创造了关键的信任差距。"
亚马逊首席技术官沃纳·沃格尔斯在AWS re:Invent 2025大会上也表达了类似观点:"现在世界正在改变。你将写更少的代码,因为生成速度很快,但你将审查更多代码,因为理解需要时间。当你自己编写代码时,理解伴随着创造行为而来。当机器编写代码时,你必须在审查过程中重建这种理解。这就是所谓的验证债务。"
企业面临管理挑战
对于雇用这些开发者的公司来说,还面临其他挑战。35%的开发者报告使用个人账户而非企业账户的AI编程工具。
开发者表示,向AI工具的转变既有好处(93%)也有缺点(88%)。他们欣赏AI在改善文档过程(57%)和帮助创建测试覆盖(53%)方面的作用。但对于看起来正确但实际错误的代码(53%)或不需要或冗余的代码(40%)则不太满意。
报告还指出,尽管75%的开发者表示AI减少了不必要的繁重工作量,但现实情况是AI工具只是将这些工作转移到新的领域,比如"纠正或重写AI编程工具创建的代码"。
有趣的是,频繁使用AI编程工具的开发者和较少使用的开发者在繁重工作上花费的时间(平均23-25%)几乎完全相同。
Q&A
Q1:开发者使用AI编程工具的比例有多高?
A:根据调查,72%使用过AI工具的开发者每天或一天多次使用这些工具,只有6%的开发者偶尔使用。开发者表示42%的代码包含AI模型的重要辅助,预计到2027年这一比例将达到65%。
Q2:什么是验证债务?
A:验证债务是指当AI生成代码时,开发者必须在审查过程中重建对代码的理解。当开发者自己编写代码时,理解伴随着创造行为而来,但当机器编写代码时,就需要额外的时间和精力来验证和理解代码的正确性。
Q3:AI编程工具给开发者带来了哪些好处和挑战?
A:好处包括改善文档过程(57%)和帮助创建测试覆盖(53%)。挑战则包括生成看起来正确但实际错误的代码(53%)、产生不需要或冗余的代码(40%),以及需要花费大量时间审查和验证AI输出的内容。
好文章,需要你的鼓励
埃森哲投资AI零售平台Profitmind,该平台通过智能代理自动化定价决策、库存管理和规划。研究显示AI驱动了2025年假日购物季20%的消费,约2620亿美元。部署AI代理的企业假日销售同比增长6.2%,而未部署的仅增长3.9%。Profitmind实时监控竞争对手价格和营销策略,并可创建生成式引擎优化产品文案。
上海AI实验室联合团队开发RoboVIP系统,通过视觉身份提示技术解决机器人训练数据稀缺问题。该系统能生成多视角、时间连贯的机器人操作视频,利用夹爪状态信号精确识别交互物体,构建百万级视觉身份数据库。实验显示,RoboVIP显著提升机器人在复杂环境中的操作成功率,为机器人智能化发展提供重要技术突破。
日立公司在CES 2026技术展上宣布了重新定义人工智能未来的"里程碑式"战略,将AI直接应用于关键物理基础设施。该公司与英伟达、谷歌云建立重要合作伙伴关系,并扩展其数字资产管理平台HMAX,旨在将AI引入社会基础设施,变革能源、交通和工业基础设施领域。日立强调其独特地位,能够将AI集成到直接影响社会的系统中,解决可持续发展、安全和效率方面的紧迫挑战。
英伟达研究团队提出GDPO方法,解决AI多目标训练中的"奖励信号坍缩"问题。该方法通过分别评估各技能再综合考量,避免了传统GRPO方法简单相加导致的信息丢失。在工具调用、数学推理、代码编程三大场景测试中,GDPO均显著优于传统方法,准确率提升最高达6.3%,且训练过程更稳定。该技术已开源并支持主流AI框架。