自由软件基金会(FSF)近日针对Anthropic公司使用其材料训练AI模型一事发声,敦促该公司开放其大语言模型。
在版权侵权诉讼Bartz诉Anthropic案中,FSF与许多其他版权持有者一样收到了和解通知。为解决这起集体诉讼,Anthropic公司于9月同意设立15亿美元基金,用于补偿那些作品被用于训练模型却未获得许可的作者。
当时,Anthropic在案件的某些方面获得了早期胜利——技术精通的法官William Alsup表示,使用书籍训练大语言模型属于"合理使用",但对于为此目的下载这些书籍是否合法的问题仍悬而未决。各方选择和解而非等待审判,版权持有者现在收到现金赔偿提议以替代潜在损害赔偿。
Anthropic使用的数据集中包含萨姆·威廉姆斯的作品《自由如自由:理查德·斯托曼的自由软件十字军》。据FSF称,该书由O'Reilly和FSF根据GNU自由文档许可证(GNU FDL)发布。
FSF写道:"这是一个允许为任何目的免费使用作品的自由许可证。"
"显然,正确的做法是保护计算自由:与大语言模型的每个用户分享完整的训练输入,连同完整的模型、训练配置设置和相应的软件源代码。"
"因此,我们敦促Anthropic和其他使用从互联网下载的大型数据集训练模型的大语言模型开发者,向用户自由提供这些大语言模型。"
虽然用户在等待奇迹发生——AI供应商不太可能满足FSF的要求(尽管The Register已向Anthropic征求评论)——FSF表示它没有资源进行旷日持久的法律战。不过,如果它参与像Batz诉Anthropic这样的诉讼,并发现其版权和许可证被违反,"我们肯定会要求用户自由作为补偿。"
这是值得称赞的,但考虑到有多少开源内容(代码或其他)已经被AI供应商吸收,这匹马早在任何人想到关闭马厩门之前就逃跑了。
这种指责不太可能感动包括Anthropic在内的供应商,除非未来的诉讼真正进入审判阶段而不是以和解告终。
更新内容:
自由软件基金会(FSF)发言人告诉The Register,其意图是"强调一个更广泛的原则:当大语言模型使用从互联网提取的庞大数据集开发时,对用户最好的结果是保护和扩展用户自由。"
FSF补充说:"FSF根据保证四项基本自由的许可证发布其作品:使用、研究、修改和分享作品的自由。我们关心的不是限制使用,而是确保这些系统的开发和分发为所有用户尊重这些相同的自由。"
Q&A
Q1:Anthropic公司为什么要设立15亿美元基金?
A:Anthropic公司为解决版权侵权集体诉讼Bartz诉Anthropic案,同意设立15亿美元基金,用于补偿那些作品被用于训练AI模型却未获得许可的作者。
Q2:自由软件基金会对AI公司有什么要求?
A:FSF要求AI公司向用户分享完整的训练输入,连同完整的模型、训练配置设置和相应的软件源代码,确保大语言模型的开发和分发尊重用户的使用、研究、修改和分享自由。
Q3:GNU自由文档许可证有什么特点?
A:GNU自由文档许可证(GNU FDL)是一个自由许可证,允许为任何目的免费使用作品,保证使用、研究、修改和分享作品的四项基本自由。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。