本周早些时候,Python字符编码检测库chardet的维护者Dan Blanchard发布了该库的新版本,采用了全新的软件许可证。此举可能彻底改变了"Copyleft"许可证的生存状态。
7.0版本采用MIT许可证,替代了之前的GNU Lesser General Public License (LGPL)。那些关注开源作品商业用途的开发者往往更青睐MIT等宽松许可证,因为它们比GPL/LGPL等Copyleft许可证施加的义务更少,后者要求衍生作品必须在相同条款下分发。
Blanchard表示,他有权更改许可证,因为他使用了AI(Anthropic的Claude现在被列为项目贡献者)进行了chardet的"洁净室"重新实现。这本质上是在不复制原始代码的情况下进行重写,尽管尚不清楚Claude在训练过程中是否摄取了chardet的代码,如果发生了这种情况,Claude的输出是否克隆了该训练数据。
一位声称是该库原始创建者Mark Pilgrim的个人在项目的GitHub仓库中开启了一个问题,认为Blanchard无权更改软件许可证,援引LPGL要求许可证保持不变的规定。
"授权代码在修改时必须在相同的LGPL许可证下发布,"这位以Pilgrim名义发帖的个人说道。"维护者声称这是'完全重写'是无关紧要的,因为他们对原始授权代码有充分的接触(即这不是'洁净室'实现)。在其中添加一个花哨的代码生成器并不能以某种方式授予他们任何额外的权利。"
Blanchard不同意这一观点,他引用了7.0.0版本和6.0.0版本在JPlag(一个检测剽窃的库)检测下的比较结果。"7.0.0版本在性质上是不同的,"他写道。"它与每个先前版本的最大相似度都在1.3%以下。7.0.0代码库中没有任何文件在结构上类似于任何先前版本中的任何文件。匹配的Token是任何项目中都会出现的常见Python模式:argparse样板代码、字典文字、导入块。"
Blanchard告诉The Register,他十多年来一直想将chardet添加到Python标准库中,因为它是大多数Python项目的核心依赖。"经过多年主要由我自己维护chardet,我清楚地意识到有几个障碍阻挡着我:它的许可证、速度和准确性,"他在邮件中说。"Claude让我能够在大约五天内完成我想要的目标。结果是检测速度提高了48倍,这将为数百万用户带来显著的性能提升(该包每月下载量约1.3亿次)。"
Flask创建者、长期开源开发者Armin Ronacher在博客文章中表示,他欢迎这一许可证变更。"我认为更有趣的是这个问题的后果,"Ronacher说。"像GPL这样的Copyleft代码严重依赖版权和摩擦来执行它。但由于它基本上是开放的,无论是否有测试,如今都可以轻易地重写它。"
AI的使用引发了对AI辅助代码需要多少人类参与才能获得版权的问题。美国最高法院最近拒绝重新考虑Thaler v. Perlmutter案,在该案中,原告寻求推翻下级法院关于他不能对AI生成图像享有版权的决定。
自由软件基金会执行董事Zoe Kooyman告诉The Register:"我们无法在不进行额外研究或咨询律师的情况下评论这个特定项目的具体情况或合法性,但摄取了被要求重新实现的代码的大语言模型并没有什么'洁净'可言。就GPL的意图而言,宽松许可证在技术上仍然是自由软件许可证,但破坏Copyleft是一种严重的行为。"
编写原始开源定义的Bruce Perens对整个软件行业有更广泛的担忧。"我正在打破玻璃拉响火警!"他在邮件中告诉The Register。"软件开发的整个经济体系已经死了、消失了、结束了、完蛋了!在不同的世界里,软件和AI的问题将由理解所有AI训练都是复制、所有AI输出都是复制的立法者和法院来处理。"
Perens预计,以前在经济上不可行生产的利基软件将会激增。"机器人将成为现实,最终会有一个为你整理房间的机器人,"他说。"它们的硬件将推动盈利公司,但我们最终可能会看到它们的推理平台变得开放。软件许可证会发生什么?专有许可证似乎几乎无关紧要。开源许可证也很可能如此,因为每个开源程序都是AI训练。"
Q&A
Q1:chardet许可证争议是怎么回事?
A:Python字符编码检测库chardet的维护者Dan Blanchard使用AI重写了代码,并将许可证从LGPL改为MIT。原创建者Mark Pilgrim认为这违反了LGPL要求,但Blanchard声称这是"洁净室"实现,相似度仅为1.3%。
Q2:AI重写代码能否规避原有许可证限制?
A:这是一个法律灰色地带。支持者认为AI生成的代码是全新实现,可以使用新许可证;反对者认为AI在训练时接触了原始代码,不算真正的"洁净室"实现,仍应遵守原有许可证。
Q3:Bruce Perens为什么说软件开发经济体系已死?
A:Perens认为AI能够轻易克隆和重写现有软件,这将颠覆传统的专有软件和开源软件模式。当代码生成成本极大降低时,传统的软件许可证和商业模式可能变得无关紧要。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。