根据Sonar公司最新发布的开发者现状调查报告显示,尽管96%的软件开发者认为AI生成的代码在功能上不够准确,但只有48%的开发者表示会在提交前始终检查AI辅助生成的代码。
这项基于全球1100多名开发者的调查发现,AI编程工具已成为常态,72%使用过这些工具的开发者每天或一天多次使用它们。只有6%的开发者偶尔使用,即每周使用不到一次。
开发者表示,他们42%的代码包含AI模型的重要辅助,预计到2027年这一比例将达到65%,而2023年这一数字仅为6%。
开发者使用AI工具的软件项目类型广泛,包括原型开发(88%)、内部生产软件(83%)、面向客户的生产软件(73%)以及关键业务服务的生产软件(58%)。
最常用的编程工具包括:GitHub Copilot(75%)、ChatGPT(74%)、Claude/Claude Code(48%)、Gemini/Duet AI(37%)、Cursor(31%)等。
验证瓶颈问题凸显
随着AI工具使用量的增长,Sonar指出这创造了一个验证瓶颈。报告称:"这个验证步骤并非微不足道。虽然AI本应节省时间,但开发者正将大量节省的时间用于审查。几乎所有开发者(95%)都要花费一定精力审查、测试和纠正AI输出。大多数人(59%)认为这种努力是'适度'或'重大'的。"
调查显示,38%的受访者表示审查AI生成的代码比审查人类生成的代码需要更多努力,而27%的人持相反观点。
Sonar首席执行官塔里克·肖卡特表示:"我们正在见证软件工程的根本转变,价值不再由编写代码的速度定义,而是由部署代码的信心定义。虽然AI使代码生成变得几乎毫不费力,但它在输出和部署之间创造了关键的信任差距。"
亚马逊首席技术官沃纳·沃格尔斯在AWS re:Invent 2025大会上也表达了类似观点:"现在世界正在改变。你将写更少的代码,因为生成速度很快,但你将审查更多代码,因为理解需要时间。当你自己编写代码时,理解伴随着创造行为而来。当机器编写代码时,你必须在审查过程中重建这种理解。这就是所谓的验证债务。"
企业面临管理挑战
对于雇用这些开发者的公司来说,还面临其他挑战。35%的开发者报告使用个人账户而非企业账户的AI编程工具。
开发者表示,向AI工具的转变既有好处(93%)也有缺点(88%)。他们欣赏AI在改善文档过程(57%)和帮助创建测试覆盖(53%)方面的作用。但对于看起来正确但实际错误的代码(53%)或不需要或冗余的代码(40%)则不太满意。
报告还指出,尽管75%的开发者表示AI减少了不必要的繁重工作量,但现实情况是AI工具只是将这些工作转移到新的领域,比如"纠正或重写AI编程工具创建的代码"。
有趣的是,频繁使用AI编程工具的开发者和较少使用的开发者在繁重工作上花费的时间(平均23-25%)几乎完全相同。
Q&A
Q1:开发者使用AI编程工具的比例有多高?
A:根据调查,72%使用过AI工具的开发者每天或一天多次使用这些工具,只有6%的开发者偶尔使用。开发者表示42%的代码包含AI模型的重要辅助,预计到2027年这一比例将达到65%。
Q2:什么是验证债务?
A:验证债务是指当AI生成代码时,开发者必须在审查过程中重建对代码的理解。当开发者自己编写代码时,理解伴随着创造行为而来,但当机器编写代码时,就需要额外的时间和精力来验证和理解代码的正确性。
Q3:AI编程工具给开发者带来了哪些好处和挑战?
A:好处包括改善文档过程(57%)和帮助创建测试覆盖(53%)。挑战则包括生成看起来正确但实际错误的代码(53%)、产生不需要或冗余的代码(40%),以及需要花费大量时间审查和验证AI输出的内容。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。