2026年,研究人员发现,你已经无法从开发者手中夺走AI编码工具了。
尽管AI无疑帮助程序员更快地生成代码,但其他研究人员警告说,它可能并没有生成更好的代码。这可能会给程序员带来长远问题。
具体来说,2026年2月,知名AI研究实验室METR公布了一个令人惊讶的发现:大多数开发者即使只是完成有限数量的任务,也不愿意在没有AI的情况下工作。
METR原本希望对2025年发布的一项关于AI编码生产力的开创性研究进行更新。在那项研究中,研究人员测量了开源开发者手动完成任务与使用AI完成任务所需的时间。
虽然该研究中的开发者报告称AI提高了他们的生产力,但当他们得知AI实际上降低了他们的工作效率时感到震惊。确实,AI生成代码更快,但随后他们花费额外时间查找和修复错误、引导AI以及等待AI完成任务。
当METR着手重复实验以衡量AI和程序员熟练度的进步时,他们无法进行下去。
研究人员坦言,开发者不愿意参与"因为他们不希望在没有AI的情况下工作",哪怕只是为了研究。
相反,METR在5月发布了一项调查,允许技术员工自我报告他们的AI生产力提升。不出所料,他们认为AI使他们对组织的价值翻了一番。
但最近关于所谓"Token最大化"的巨额开支的头条新闻,加上近期的一些研究,使这种自我认知变得可疑。
Token最大化,即使用一个人使用的Token数量作为AI生产力的代理指标,是2026年迄今为止的趋势。而它可能已经结束了。
据《金融时报》本周报道,亚马逊关闭了其内部Token追踪排行榜Kirorank,因为员工过度使用AI智能体来刷榜,导致成本飙升。这些员工证明了AI使用并不会自动转化为生产力提升。
据The Information报道,Uber在2026年前四个月就用完了全年的AI预算。首席运营官Andrew Macdonald最近在播客中表示,这样的支出并没有带来项目或生产力的可衡量增长。
程序员兼作家James Shore在一篇在Hacker News上疯传的博客文章中精辟地指出,AI生成的代码也不一定能减少持续的代码维护需求,甚至可能增加维护负担。
"你现在写代码的速度快了一倍?最好希望你的维护成本也减半了,"他写道。"否则,你就完了。你是在用暂时的速度提升换取永久的束缚。"
还有其他证据表明AI可能增加代码维护困扰。
可靠性工程智能体初创公司Entelligence AI的创始人兼首席执行官Aiswarya Sankar的一条病毒式推文宣称,公司将44%的Token花在修复AI生成的错误上。与此同时,代码审查工具公司Code Rabbit表示,它分析了开源拉取请求,发现AI产生的问题是人类代码的1.7倍。
诚然,这些是那些试图销售AI代码审查工具的公司提供的自利统计数据。
然而,独立研究人员也发现了类似问题。来自新加坡管理大学的研究人员在4月发布的报告中警告说,"AI生成的代码可能会给实际软件项目带来长期维护成本。"
鉴于程序员热爱他们的AI助手,解决方案是什么?
那些想向你销售AI编码智能体的人说,开发者可以使用AI编码智能体来完成修复AI快速生成代码的繁重任务。这是Cognition创始人兼首席执行官Scott Wu——AI编码智能体Devin的制造商——的建议。
但即使他也承认,虽然Devin可以独立工作,但他目前会将其技能评级为初级到中级程序员之间,具体取决于任务。这不是一个交付后就可以忘记的解决方案。
新加坡管理大学的研究人员建议采用更人性化的方法。程序员应该像了解他们最喜欢的编码语言一样深入了解AI擅长和不擅长的任务。他们需要为AI设计强大的质量保证系统,并且必须像审查初级开发者的工作一样仔细审查AI的工作。
与此同时,研究人员表示(Wu也同意),人类仍应该负责软件架构和安全设计等宏观工作。
Q&A
Q1:METR在2026年的研究发现了什么?
A:METR在2026年2月发现,大多数开发者即使只是完成有限数量的任务,也不愿意在没有AI的情况下工作。当他们试图重复之前关于AI编码生产力的实验时,无法找到愿意参与的开发者,因为开发者拒绝在没有AI的情况下工作,哪怕只是为了研究。
Q2:AI编码工具真的能提高程序员的生产力吗?
A:虽然开发者普遍认为AI提高了他们的生产力,但研究显示情况可能相反。2025年的研究发现,AI实际上降低了开发者的工作效率。虽然AI生成代码更快,但程序员随后需要花费额外时间查找和修复错误、引导AI以及等待AI完成任务。亚马逊和Uber的案例也显示,大量使用AI并没有带来可衡量的生产力提升。
Q3:AI生成的代码会带来什么问题?
A:AI生成的代码可能会增加长期维护成本。研究显示,公司将44%的Token花在修复AI生成的错误上,AI产生的问题是人类代码的1.7倍。新加坡管理大学的研究人员警告说,AI生成的代码可能给实际软件项目带来长期维护成本。程序员需要像审查初级开发者的工作一样仔细审查AI的工作。
好文章,需要你的鼓励
本周早些时候,苹果推出了即将发布的26.6更新的首个测试版,现在公司已发布公开测试版本,包括iPadOS 26.6、tvOS 26.6等。距离苹果揭晓iOS 27等重大软件更新不到两周时间。目前26.6更新改动较少,仅发现在达到上限后屏蔽联系人时会出现提醒。苹果将于6月8日WWDC主题演讲中发布iOS 27等新系统。
多伦多大学与Adobe联合提出DLA模块,让多模态大语言模型与扩散模型协同工作,有效解决AI图片生成中的"复印机"问题,同时提升复杂指令的跨模态理解能力。
这款支持Matter认证的Edison智能灯泡目前在亚马逊Prime会员专属折扣活动中以超低价格出售,四只装套装平均每只不足8美元。Matter认证意味着该灯泡可与主流智能家居平台无缝兼容,适合正在构建或扩展智能家居系统的用户。此次折扣为Prime会员专属优惠,有意购买的用户可关注活动时效。
这项由字节跳动Seed与北京大学联合发表的研究(arXiv:2605.26895)揭示:大语言模型归一化层中参数量不足万分之一的缩放向量,对训练效率有显著影响,并提出了系统性的改进策略。