GitHub通过其Copilot产品为AI生成代码打开了闸门,如今正考虑在短期内至少部分关闭这扇门。
GitHub正在探索一个看起来已经颇具争议的想法,允许代码仓库或项目的维护者删除拉取请求或关闭接收拉取请求的功能,以应对大量低质量、通常由AI生成的贡献涌入,这让许多开源项目难以管理。
上周,GitHub产品经理Camilla Moraes在GitHub上发布了社区讨论帖,寻求对其正在考虑的解决方案的反馈,以解决"日益增长的低质量贡献量"问题,这给开源项目和代码仓库维护者带来了重大运营挑战。
"我们听到你们反馈,正在花费大量时间审查那些由于多种原因不符合项目质量标准的贡献——它们未能遵循项目指南,经常在提交后不久就被抛弃,而且通常是AI生成的,"Moraes写道,随后列出了计划中的解决方案。
讨论帖中的几位用户同意Moraes的观点,认为AI生成的代码确实给维护者带来了挑战。
微软Azure容器上游团队的软件工程师、Containerd的Runwasi项目和SpinKube的维护者Jiaxiao Zhou指出,AI生成的代码使得维护者逐行审查交付的代码变得不可持续。
这位维护者列出了几个原因,比如代码审查背后的信任模式被破坏,审查者不能再假设贡献者完全理解他们提交的内容;AI生成的拉取请求可能在结构上看起来合理,但在逻辑上存在缺陷或不安全;以及逐行审查对生产代码仍然是强制性的,但无法扩展到大规模AI辅助的更改。
为了在短期内解决这些挑战,Moraes写道,GitHub计划提供可配置的拉取请求权限,即通过将贡献限制为仅协作者或为特定用例(如镜像仓库)禁用拉取请求,来更精细地控制拉取请求访问。
"这也消除了各种开源项目为管理贡献而构建自定义自动化的需要,"Moraes写道。
然而,关于禁用拉取请求的具体建议遭到了质疑。
用户名为ThiefMaster的用户建议,GitHub不应考虑限制对之前开放的拉取请求的访问,因为这可能导致某人失去内容或访问权限。相反,该用户建议GitHub应允许用户通过直接链接访问它们。
Moraes在回应中似乎认同了该用户的观点,并表示GitHub可能会采纳用户的建议。
此外,GitHub还在考虑为维护者提供直接从界面删除垃圾邮件或低质量拉取请求的功能,以改善代码仓库组织。
这个建议遭到了用户更大的质疑。
虽然ThiefMaster建议GitHub应允许维护者在有限时间框架内删除拉取请求,很可能是由于活动度低,但其他用户如Tibor Digana、Hayden和Matthew Gamble完全反对这个想法。
Moraes的长期建议中包括使用基于AI的工具来帮助维护者筛除"不必要"的提交并专注于有价值的提交,这也受到了相当大的批评。
虽然Moraes和GitHub声称这些基于AI的工具将减少审查提交所需的时间,但Stephen Rosen等用户认为基于AI的工具会起到完全相反的作用,因为它们容易出现幻觉,迫使维护者无论如何都要检查每一行代码。
智能体AI软件初创公司Doozer AI的联合创始人Paul Chada认为,基于AI的审查工具的有用性将取决于内置的防护栏和过滤器的强度。
他说,没有这些控制,此类系统有风险让维护者收到缺乏项目背景的提交,浪费审查时间,并稀释有意义的信号。
"维护者不想要另一个他们必须质疑的系统。AI应该像垃圾邮件过滤器或助手一样工作,而不是具有权威的审查者。谨慎使用,它会减少噪音。粗心使用,它会增加一层新的不确定性,而不是消除一层,"Chada说道。
GitHub还提出了其他长期建议来解决审查者的认知负担,例如在拉取请求生命周期中使用AI工具时改善可见性和归属,以及为确定谁可以创建和审查拉取请求提供更精细的控制,而不是阻止所有用户或仅限制为协作者。
Q&A
Q1:GitHub为什么考虑限制拉取请求功能?
A:GitHub考虑限制拉取请求是为了应对大量低质量、通常由AI生成的代码贡献涌入。这些贡献给开源项目维护者带来了重大运营挑战,维护者需要花费大量时间审查不符合项目质量标准的代码,这些代码往往未遵循项目指南,经常在提交后被抛弃。
Q2:GitHub计划采取哪些措施来解决AI生成代码问题?
A:GitHub计划提供可配置的拉取请求权限,允许维护者更精细地控制拉取请求访问,比如将贡献限制为仅协作者或为特定用例禁用拉取请求。还考虑让维护者能够直接从界面删除垃圾邮件或低质量拉取请求,以及使用基于AI的工具帮助筛选提交。
Q3:开发者对GitHub的这些限制措施有什么反应?
A:开发者对这些措施反应不一。一些维护者同意AI生成代码确实带来挑战,但对具体实施方案存在质疑。比如有用户担心禁用拉取请求可能导致内容丢失,对删除功能表示反对,对AI审查工具的效果也持怀疑态度,认为AI工具容易出现幻觉,可能增加而非减少工作量。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。