在 ChatGPT 的新 AI 图像生成器上线仅一天后,社交媒体上就已经充斥着大量以吉卜力工作室风格创作的 AI 生成梗图。吉卜力工作室是制作了《龙猫》和《千与千寻》等重磅电影的日本著名动画工作室。
在过去 24 小时内,我们看到了 AI 生成的吉卜力风格版本的埃隆·马斯克、《指环王》和唐纳德·特朗普总统的图像。OpenAI 的 CEO Sam Altman 似乎也将自己的个人头像换成了一张吉卜力风格的图片,这很可能是用 GPT-4o 的原生图像生成器制作的。用户们似乎在向 ChatGPT 上传现有图片,并要求聊天机器人以新的风格重新创作。
OpenAI 的这次更新紧随 Google 在其 Gemini Flash 模型中发布类似 AI 图像功能之后。Google 的功能在 3 月初也曾引发热议,当时人们用它来移除图片水印。
OpenAI 和 Google 的最新工具让重现受版权保护作品的风格变得前所未有的简单——只需输入文字提示即可。这些新的 AI 图像功能似乎重新引发了几起针对生成式 AI 模型开发商诉讼案件的核心问题:如果这些公司使用受版权保护的作品进行训练,是否违反了版权法?
Neal & McDevitt 律师事务所的知识产权律师 Evan Brown 表示,像 GPT-4o 原生图像生成器这样的产品目前处于法律的灰色地带。根据 Brown 的说法,风格本身并不受版权保护,这意味着 OpenAI 仅仅生成看起来像吉卜力电影风格的图像并不违法。
然而,Brown 表示,OpenAI 很可能是通过训练其模型使用了数百万帧吉卜力电影画面才达到这种相似效果。即使是这种情况,多个法院仍在裁定用受版权保护的作品训练 AI 模型是否属于合理使用范畴。
Brown 在采访中说:"我认为这引发了我们这几年一直在问自己的同样问题:抓取网页内容并复制到这些数据库中,会带来什么样的版权侵权影响?"
《纽约时报》和多家出版商正在起诉 OpenAI,声称该公司在未经适当署名或付费的情况下使用受版权保护的作品训练其 AI 模型。类似的诉讼也针对其他主要 AI 公司提起,包括 Meta 和 AI 图像生成初创公司 Midjourney。
OpenAI 发言人在接受 TechCrunch 采访时表示,虽然 ChatGPT 拒绝复制"在世艺术家的个人风格",但 OpenAI 允许复制"更广泛的工作室风格"。当然,值得注意的是,确实有在世艺术家因开创其工作室独特风格而受到赞誉,比如吉卜力工作室的联合创始人宫崎骏。
显然,用户也能够使用 GPT-4o 的原生图像生成功能重现其他工作室和艺术家的风格。有人制作了赛斯博士风格的 Marc Andreessen 肖像,还有一对夫妇将他们的婚纱照重新创作成皮克斯风格。
我们测试了几个流行的 AI 图像生成器——包括 Google 的 Gemini、xAI 的 Grok 和 Playground.ai——以检验它们模仿吉卜力工作室风格的能力。我们发现 OpenAI 的新图像生成器最能准确复制这家动画工作室的风格。
一只真实的狗 (左) 和 ChatGPT 以吉卜力工作室风格生成的狗的图像 (右)。
目前,OpenAI 和 Google 的新图像功能展示了 AI 模型在生成能力上的重大突破,这似乎推动了使用量的激增。周三,OpenAI 因需求量太大而推迟向免费用户推出其新图像工具。这对这些公司来说可能是当下最重要的事情,但我们还需要等待法院对其合法性作出裁决。
好文章,需要你的鼓励
数据分析平台公司Databricks完成10亿美元K轮融资,公司估值超过1000亿美元,累计融资总额超过200亿美元。公司第二季度收入运营率达到40亿美元,同比增长50%,AI产品收入运营率超过10亿美元。超过650家客户年消费超过100万美元,净收入留存率超过140%。资金将用于扩展Agent Bricks和Lakebase业务及全球扩张。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
医疗信息管理平台Predoc宣布获得3000万美元新融资,用于扩大运营规模并在肿瘤科、研究网络和虚拟医疗提供商中推广应用。该公司成立于2022年,利用人工智能技术提供端到端平台服务,自动化病历检索并整合为可操作的临床洞察。平台可实现病历检索速度提升75%,临床审查时间减少70%,旨在增强而非替代临床判断。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。