Google 正在通过在使用其强大的 Reimagine 工具编辑的图片中添加不可见的数字水印,使识别 AI 修改过的图片变得更加容易。
2 月 9 日更新:本文最初发表于 2 月 7 日
Reimagine 作为 Google Photos Magic Editor 功能的一部分随 Pixel 9 系列推出,允许用户圈选图片中的任何区域,通过输入简单的文本提示将其转换成任何想要的内容。这些 AI 生成的编辑通常富有创意且有趣,但可能具有误导性,因为很难分辨什么是真实的,什么是虚假的。
Google Photos:AI 生成图片将被添加水印
根据最近的 Google Photos 博客文章披露,使用 Reimagine 处理的图片将使用 Google DeepMind 的 SynthID 技术接收一个不可见的嵌入式水印,这将提醒他人存在 AI 驱动的修改。如果图片包含 SynthID 水印,你可以通过查看其关联的"关于此图片"信息来确认。
如果图片是使用 Google 的 AI 工具编辑的,这些信息将使在社交媒体或通过消息应用发送的假图片更容易被发现。
例如,使用 Reimagine 编辑的图片将在 Google Photos 中显示"AI 信息"部分,标注"来源:使用 Google AI 编辑,数字源类型:使用生成式 AI 编辑"。你也可以在 Google Photos 之外查看这些信息:如果有人向你发送可疑照片,只需使用 Circle to Search 检查图片并验证上述 AI 生成的元素。
SynthID 水印只能由特定的解码软件读取,肉眼无法看见。由于它们是图片本身的一部分,比普通的图片标签更难移除,而普通标签任何人都可以轻易地从图片文件中删除,无论是故意还是在使用不保留这些标签的软件时意外删除。
Google 已经在使用 SynthID 为其 Imagen 图像生成工具创建的图片添加水印。现在,它将这一功能添加到用户使用 Reimagine 编辑的图片中,无论是否为 AI 生成。Reimagine 目前仅在 Pixel 9 系列及更新机型上可用,但所有设备都可以读取 SynthID 水印。
Google Photos AI 水印 — 一个不完美的解决方案
SynthID 水印设计为能够抵抗常规编辑和操作,难以移除。然而,重复编辑可能导致它们退化。此外,Google 指出,细微的编辑,例如"改变图片背景中小花的颜色",可能仍会漏网,因为这些变化可能太小,SynthID 无法检测到。
除了图片外,SynthID 还可以为音频、文本和视频添加水印。用于编码和解码文本中 SynthID 水印的软件已经公开可用,但 Google 目前仍对其基于图像的水印工具保密。这种方法有助于减缓那些可能开发规避技术的人的步伐,但也意味着,没有公开审查,我们无法知道 Google 可能会在我们的图片中嵌入什么其他信息。
2 月 9 日更新:SynthID 必须更广泛地可用才能真正发挥作用
Google 必须使 SynthID 工具更广泛可用
虽然 Google 为其 AI 生成工具添加水印的举措值得称赞,但用于图像的 SynthID 只是打击深度伪造和 AI 生成虚假信息的一个小武器。一个重要的限制因素是,与文本文档不同,只有 Google 可以检测图像中的 SynthID 水印。这意味着虽然 Google Photos、Circle to Search 和 Google Lens 会标记带有 SynthID 水印的图像,但其他软件和服务不会。
例如,如果你将"重新构想"的图片上传到 Instagram,该应用程序不会检测到你的图片包含 AI 生成的组件。Instagram 会提示用户在适当的情况下为上传的图片添加 AI 标签,并指出 Meta 在某些情况下要求使用此类标签。但是,激活标签的决定仍然取决于上传者。
这与其他工具不同,例如 Adobe Photoshop 使用行业标准标签,Instagram 等服务可以读取这些标签来自动标记 AI 生成的内容。为确保更广泛的采用,Google 必须让第三方能够使用 SynthID 解码器来处理文本和图像。
Magic Editor 的普通用户可能不会在意,甚至不知道 Google 的水印。然而,那些试图故意误导他人的人几乎肯定能够绕过它。许多免费和开源工具不会,也永远不会强制用户嵌入标识其输出为 AI 生成的标签或水印。
在 Instagram 上关注 @paul_monckton。
好文章,需要你的鼓励
Jabra 推出 PanaCast 40 VBS:首款专为小会议室设计的 180° Android 智能音视频一体机
这是一项关于计算机视觉技术突破的研究,由多家知名院校联合完成。研究团队开发了LINO-UniPS系统,能让计算机像人眼一样从不同光照下的照片中准确识别物体真实的表面细节,解决了传统方法只能在特定光照条件下工作的局限性,为虚拟现实、文物保护、工业检测等领域带来重要应用前景。
字节跳动智能创作实验室发布革命性AI视频数据集Phantom-Data,解决视频生成中的"复制粘贴"问题。该数据集包含100万个跨场景身份一致配对,通过三阶段构建流程实现主体检测、多元化检索和身份验证,显著提升文本遵循能力和视频质量。
这篇文章介绍了北京人工智能研究院开发的OmniGen2模型,一个能够同时处理文字转图像、图像编辑和情境生成的全能AI系统。该模型采用双轨制架构,分别处理文本和图像任务,并具备独特的自我反思机制,能够自动检查和改进生成结果。研究团队还开发了专门的数据构建流程和OmniContext评测基准,展现了开源模型的强大潜力。