在 ChatGPT 的新 AI 图像生成器上线仅一天后,社交媒体上就已经充斥着大量以吉卜力工作室风格创作的 AI 生成梗图。吉卜力工作室是制作了《龙猫》和《千与千寻》等重磅电影的日本著名动画工作室。
在过去 24 小时内,我们看到了 AI 生成的吉卜力风格版本的埃隆·马斯克、《指环王》和唐纳德·特朗普总统的图像。OpenAI 的 CEO Sam Altman 似乎也将自己的个人头像换成了一张吉卜力风格的图片,这很可能是用 GPT-4o 的原生图像生成器制作的。用户们似乎在向 ChatGPT 上传现有图片,并要求聊天机器人以新的风格重新创作。
OpenAI 的这次更新紧随 Google 在其 Gemini Flash 模型中发布类似 AI 图像功能之后。Google 的功能在 3 月初也曾引发热议,当时人们用它来移除图片水印。
OpenAI 和 Google 的最新工具让重现受版权保护作品的风格变得前所未有的简单——只需输入文字提示即可。这些新的 AI 图像功能似乎重新引发了几起针对生成式 AI 模型开发商诉讼案件的核心问题:如果这些公司使用受版权保护的作品进行训练,是否违反了版权法?
Neal & McDevitt 律师事务所的知识产权律师 Evan Brown 表示,像 GPT-4o 原生图像生成器这样的产品目前处于法律的灰色地带。根据 Brown 的说法,风格本身并不受版权保护,这意味着 OpenAI 仅仅生成看起来像吉卜力电影风格的图像并不违法。
然而,Brown 表示,OpenAI 很可能是通过训练其模型使用了数百万帧吉卜力电影画面才达到这种相似效果。即使是这种情况,多个法院仍在裁定用受版权保护的作品训练 AI 模型是否属于合理使用范畴。
Brown 在采访中说:"我认为这引发了我们这几年一直在问自己的同样问题:抓取网页内容并复制到这些数据库中,会带来什么样的版权侵权影响?"
《纽约时报》和多家出版商正在起诉 OpenAI,声称该公司在未经适当署名或付费的情况下使用受版权保护的作品训练其 AI 模型。类似的诉讼也针对其他主要 AI 公司提起,包括 Meta 和 AI 图像生成初创公司 Midjourney。
OpenAI 发言人在接受 TechCrunch 采访时表示,虽然 ChatGPT 拒绝复制"在世艺术家的个人风格",但 OpenAI 允许复制"更广泛的工作室风格"。当然,值得注意的是,确实有在世艺术家因开创其工作室独特风格而受到赞誉,比如吉卜力工作室的联合创始人宫崎骏。
显然,用户也能够使用 GPT-4o 的原生图像生成功能重现其他工作室和艺术家的风格。有人制作了赛斯博士风格的 Marc Andreessen 肖像,还有一对夫妇将他们的婚纱照重新创作成皮克斯风格。
我们测试了几个流行的 AI 图像生成器——包括 Google 的 Gemini、xAI 的 Grok 和 Playground.ai——以检验它们模仿吉卜力工作室风格的能力。我们发现 OpenAI 的新图像生成器最能准确复制这家动画工作室的风格。
一只真实的狗 (左) 和 ChatGPT 以吉卜力工作室风格生成的狗的图像 (右)。
目前,OpenAI 和 Google 的新图像功能展示了 AI 模型在生成能力上的重大突破,这似乎推动了使用量的激增。周三,OpenAI 因需求量太大而推迟向免费用户推出其新图像工具。这对这些公司来说可能是当下最重要的事情,但我们还需要等待法院对其合法性作出裁决。
好文章,需要你的鼓励
英特尔携手戴尔以及零克云,通过打造“工作站-AI PC-云端”的协同生态,大幅缩短AI部署流程,助力企业快速实现从想法验证到规模化落地。
意大利ISTI研究院推出Patch-ioner零样本图像描述框架,突破传统局限实现任意区域精确描述。系统将图像拆分为小块,通过智能组合生成从单块到整图的统一描述,无需区域标注数据。创新引入轨迹描述任务,用户可用鼠标画线获得对应区域描述。在四大评测任务中全面超越现有方法,为人机交互开辟新模式。
阿联酋阿布扎比人工智能大学发布全新PAN世界模型,超越传统大语言模型局限。该模型具备通用性、交互性和长期一致性,能深度理解几何和物理规律,通过"物理推理"学习真实世界材料行为。PAN采用生成潜在预测架构,可模拟数千个因果一致步骤,支持分支操作模拟多种可能未来。预计12月初公开发布,有望为机器人、自动驾驶等领域提供低成本合成数据生成。
MIT研究团队发现,AI系统无需严格配对的多模态数据也能显著提升性能。他们开发的UML框架通过参数共享让AI从图像、文本、音频等不同类型数据中学习,即使这些数据间没有直接对应关系。实验显示这种方法在图像分类、音频识别等任务上都超越了单模态系统,并能自发发展出跨模态理解能力,为未来AI应用开辟了新路径。