Meta 被指控使用存在争议的盗版内容训练 AI 模型

最新法庭文件揭示,Meta 公司涉嫌从一个因版权侵犯被起诉的在线资源下载材料,用于训练其 AI 模型。这一指控引发了对 AI 训练数据来源的质疑,突显了人工智能发展中的知识产权问题。该案件可能对 AI 行业产生深远影响,引发人们对 AI 伦理和合规的更多思考。

根据最新的法庭文件显示，Meta 被指控为了训练其 AI 模型，从一个因侵犯版权而被起诉的在线资源库下载了大量内容。

这项指控出现在 Richard Kadrey 等人诉 Meta Platforms 的案件文件中。小说家 Kadrey (以及包括喜剧演员 Sarah Silverman 在内的其他人) 声称他们的作品的盗版被用于训练 AI 模型。目前已有多起类似诉讼，针对不同的 AI 企业。

文件称，Meta 决定从 Library Genesis (简称 "LibGen") 下载文档来训练其模型。LibGen 正面临教科书出版商的诉讼，这些出版商认为它随意托管和分发盗版作品，甚至接受捐款来资助其运营。

Kadrey 案件原告提交的文件显示，Meta 在证据开示过程中提供的文件描述了公司内部关于访问 LibGen 的争论，对在办公室使用 BitTorrent 的些许顾虑，以及最终上报给 "MZ" 并获得批准使用这个有争议的资源。文件指出，有关使用 LibGen 的证据是新发现的，是 Meta 在证据开示过程后期才提供的。

Meta 提交的第三份文件则辩称，原告无理地声称使用 LibGen 是新材料，并坚称这些信息已在记录中存在数月之久。

此事的关键似乎是原告试图利用 Meta 使用 LibGen 的信息，根据《加利福尼亚州综合计算机数据访问和欺诈法案》提起诉讼。该法律规定，未经许可访问计算机或网络并意图欺诈或实施其他犯罪行为属于犯罪。Meta 认为这项额外的诉讼理由不成立。

Meta 的文件包含一份声明，称公司"拒绝接受其'分发'了 LibGen 的说法"，似乎是为了回应原告认为仅使用 BitTorrent 就意味着传播盗版内容的论点。但我们没有找到否认访问 LibGen 的声明。

Meta 试图以商业敏感性为由要求封存我们上面链接的文件。但案件的法官驳回了这一请求，认为 Meta 只是想避免公众关注。

美国地方法院法官 Vince Chhabria 还指出，在 Meta 想要封存的一份文件中，一名员工写道：

"如果媒体报道暗示我们使用了已知是盗版的数据集（如 LibGen），这可能会削弱我们在这些问题上与监管机构的谈判地位。"

考虑到 Meta 的商业模式建立在用户贡献的免费内容之上，这个使用 LibGen 的指控与其品牌形象非常吻合。为什么要对那些讨厌的作者另眼相看呢？

来源：The Register

0赞

好文章，需要你的鼓励

Meta 被指控使用存在争议的盗版内容训练 AI 模型

来源：The Register

2025

01/14

09:47

分享

点赞

联想集团混合式AI实践获权威肯定，CES期间获评“全球科技引领企业”

CES上杨元庆首谈AGI，碾压人类的叙事不会让AI更聪明

CES 2026 | 重大更新：NVIDIA DGX Spark开启“云边端”模式

Gmail新增Gemini驱动AI功能，智能优先级和摘要来袭

研究发现商业AI模型可完整还原《哈利·波特》原著内容

Razer在2026年CES展会推出全息AI伴侣项目

CES 2026：英伟达新架构亮相，AMD发布新芯片，Razer推出AI奇异产品

通过舞蹈认识LimX Dynamics的人形机器人Oli

谷歌为Gmail搜索引入AI概览功能并推出实验性AI智能收件箱

DuRoBo Krono：搭载AI助手的智能手机尺寸电子阅读器

OpenAI推出ChatGPT Health医疗问答功能

Anthropic寻求3500亿美元估值融资100亿美元

最热门的 AI 模型：它们的功能和使用方法

这款古怪的 AI 智能手机可以创建你的数字分身

Faireez 获 750 万美元融资，为租赁市场提供 AI 驱动的酒店式管家服务

Broadcom 大获全胜：70% 大型 VMware 客户购买其最全面解决方案

Peer 获得1050万美元元宇宙引擎投资，推出3D个人星球功能

获 3000 万美元融资，Crogl 发布面向安全分析师的全新 AI "钢铁侠战衣"

Turing 获得 1.11 亿美元融资，估值达到 22 亿美元，为 OpenAI 等大语言模型公司提供关键代码支持

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

Welevel 获得 570 万美元融资，革新程序化游戏开发

AI 驱动的卓越运营：企业如何通过人人可及的流程智能提升成功

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: