在 ChatGPT 的新 AI 图像生成器上线仅一天后,社交媒体上就已经充斥着大量以吉卜力工作室风格创作的 AI 生成梗图。吉卜力工作室是制作了《龙猫》和《千与千寻》等重磅电影的日本著名动画工作室。
在过去 24 小时内,我们看到了 AI 生成的吉卜力风格版本的埃隆·马斯克、《指环王》和唐纳德·特朗普总统的图像。OpenAI 的 CEO Sam Altman 似乎也将自己的个人头像换成了一张吉卜力风格的图片,这很可能是用 GPT-4o 的原生图像生成器制作的。用户们似乎在向 ChatGPT 上传现有图片,并要求聊天机器人以新的风格重新创作。
OpenAI 的这次更新紧随 Google 在其 Gemini Flash 模型中发布类似 AI 图像功能之后。Google 的功能在 3 月初也曾引发热议,当时人们用它来移除图片水印。
OpenAI 和 Google 的最新工具让重现受版权保护作品的风格变得前所未有的简单——只需输入文字提示即可。这些新的 AI 图像功能似乎重新引发了几起针对生成式 AI 模型开发商诉讼案件的核心问题:如果这些公司使用受版权保护的作品进行训练,是否违反了版权法?
Neal & McDevitt 律师事务所的知识产权律师 Evan Brown 表示,像 GPT-4o 原生图像生成器这样的产品目前处于法律的灰色地带。根据 Brown 的说法,风格本身并不受版权保护,这意味着 OpenAI 仅仅生成看起来像吉卜力电影风格的图像并不违法。
然而,Brown 表示,OpenAI 很可能是通过训练其模型使用了数百万帧吉卜力电影画面才达到这种相似效果。即使是这种情况,多个法院仍在裁定用受版权保护的作品训练 AI 模型是否属于合理使用范畴。
Brown 在采访中说:"我认为这引发了我们这几年一直在问自己的同样问题:抓取网页内容并复制到这些数据库中,会带来什么样的版权侵权影响?"
《纽约时报》和多家出版商正在起诉 OpenAI,声称该公司在未经适当署名或付费的情况下使用受版权保护的作品训练其 AI 模型。类似的诉讼也针对其他主要 AI 公司提起,包括 Meta 和 AI 图像生成初创公司 Midjourney。
OpenAI 发言人在接受 TechCrunch 采访时表示,虽然 ChatGPT 拒绝复制"在世艺术家的个人风格",但 OpenAI 允许复制"更广泛的工作室风格"。当然,值得注意的是,确实有在世艺术家因开创其工作室独特风格而受到赞誉,比如吉卜力工作室的联合创始人宫崎骏。
显然,用户也能够使用 GPT-4o 的原生图像生成功能重现其他工作室和艺术家的风格。有人制作了赛斯博士风格的 Marc Andreessen 肖像,还有一对夫妇将他们的婚纱照重新创作成皮克斯风格。
我们测试了几个流行的 AI 图像生成器——包括 Google 的 Gemini、xAI 的 Grok 和 Playground.ai——以检验它们模仿吉卜力工作室风格的能力。我们发现 OpenAI 的新图像生成器最能准确复制这家动画工作室的风格。
一只真实的狗 (左) 和 ChatGPT 以吉卜力工作室风格生成的狗的图像 (右)。
目前,OpenAI 和 Google 的新图像功能展示了 AI 模型在生成能力上的重大突破,这似乎推动了使用量的激增。周三,OpenAI 因需求量太大而推迟向免费用户推出其新图像工具。这对这些公司来说可能是当下最重要的事情,但我们还需要等待法院对其合法性作出裁决。
好文章,需要你的鼓励
讨论AI发展前景及其对各行业的影响,以及加速计算的未来。演讲将涵盖人工智能、机器人技术、仿真、游戏和内容创作等前沿技术。此次演讲备受关注,特别是在英伟达与Synopsys深化合作以及收购Groq和SchedMD之后。观众可通过YouTube观看直播。
SimWorld是由UCSD等多所顶尖院校联合开发的革命性AI仿真平台,基于虚幻引擎5构建了具备真实物理规律的虚拟城市环境。该平台支持无限扩展的程序化世界生成和自然语言交互,让AI智能体能够在复杂环境中学会生存、合作和竞争,为通用人工智能的发展提供了前所未有的训练平台。
波士顿动力在CES 2026上发布了新版Atlas通用人形机器人。新原型机以轻快且极其类人的步伐登台,展现了令人印象深刻的行走能力。该机器人拥有56个自由度,配备全旋转关节和具备触觉感知的人类尺寸手部,能够执行材料排序、装配和机器维护等任务。Atlas将首先在现代汽车集团位于乔治亚州萨凡纳的制造工厂投入使用。现代汽车还宣布与谷歌DeepMind合作,将Gemini机器人技术集成到波士顿动力系统中,推动物理AI领域发展。
浙江大学联合华为提出C2DLM,这是一种因果概念引导的扩散语言模型,通过自动提取因果关系并融入注意力机制来增强AI推理能力。相比传统方法,C2DLM在推理任务上平均提升1.31%-12%,训练效率提高3.2倍,为解决语言模型推理能力不足开辟了新路径。