当你让AI照镜子时,它并不总能认出自己。当你要求它判断一张图像是真实的还是AI生成的时候,你会有这种感受。
谷歌上周尝试帮助我们区分真实和深度伪造内容,尽管功能极其有限。在Gemini应用中,你可以分享一张图片并询问它是否真实,Gemini会检查SynthID(数字水印)来告诉你这张图片是否由谷歌的AI工具制作。(另一方面,谷歌上周还推出了Nano Banana Pro这一新的图像模型,这使得肉眼识别假图变得更加困难。)
在这个有限的范围内,谷歌的真实性检查功能表现相当不错。Gemini工作迅速,会告诉你某个内容是否由谷歌AI制作。在我的测试中,它甚至能识别图像的截图。答案快速且切中要点——是的,这张图片,或者至少其中一半以上是假的。
但如果你询问的是由其他任何图像生成器制作的图片,你就不会得到那种确凿的答案。你得到的是证据分析:模型会寻找所有典型的人工制作痕迹。在这种情况下,它基本上是在做我们用肉眼做的事情,但我们仍然无法完全信任其结果。
尽管谷歌的SynthID检查既可靠又必要,但让聊天机器人评估缺乏水印的内容几乎毫无价值。谷歌提供了一个检查图像来源的有用工具,但如果我们要在互联网上重新信任自己的眼睛,我们使用的每个AI界面都应该能够检查来自各种AI模型的图像。
我希望很快我们就能把图像直接拖到谷歌搜索中,找出它是否是假的。深度伪造技术变得太好了,我们不能没有这种现实检查。
使用聊天机器人检查图像结果参差不齐
关于谷歌的SynthID检查,没有太多可说的。当你要求Gemini(在应用程序中)评估谷歌生成的图像时,它知道自己在看什么。它很有效。我希望看到它在Gemini出现的所有地方推出——比如浏览器版本和谷歌搜索——根据谷歌关于该功能的博客文章,这已经在进行中了。
浏览器中的Gemini还没有这个功能,这意味着我们可以看到模型(没有SynthID)在被问及AI生成的图像是否真实时是如何回应的。我要求浏览器版本的Gemini评估一张信息图,这是谷歌提供给记者的资料,展示其新的Nano Banana Pro模型的实际应用。这是AI生成的——甚至在其元数据中也这样说了。应用中的Gemini使用SynthID识别出来了。浏览器中的Gemini则模棱两可:它说设计可能来自AI或人类设计师。它甚至说其SynthID工具没有发现任何表明AI的东西。(尽管当我要求它再试一次时,它说工具出现了错误。)底线是?它无法判断。
其他聊天机器人怎么样?我让Nano Banana Pro生成了一张燕尾服猫躺在大富翁棋盘上的图片。这张图片乍一看是真实可信的。我发送给毫不知情的同事们,他们以为这是我的猫。但如果你仔细观察,你会看到错误:例如,大富翁套装毫无意义——公园大道在多个错误的位置,颜色也不对。
我询问了各种AI聊天机器人和模型这张图片是否是AI生成的,答案五花八门。
我手机上的Gemini使用SynthID检查器立即识别出来了。Gemini 3这个本周发布的更高级推理模型,提供了详细分析,说明为什么它是AI生成的。Gemini 2.5 Flash(选择"快速"时的默认模型)基于细节水平和真实性猜测它是真实照片。我在两个不同的日子里尝试了两次ChatGPT,它给了我两个不同的答案,一个详细解释了它明显是真实的,另一个同样长篇大论地说明为什么它是假的。使用Haiku 4.5和Sonnet 4.5模型的Claude说它看起来是真实的。
当我测试由非谷歌AI工具生成的图像时,聊天机器人根据生成质量进行评估。有明显痕迹的图像——例如,不匹配的光照和渲染不佳的文本——更可靠地被识别为AI生成。但主题是不一致性。实际上,它并不比用我自己的眼睛深入、批判性地观察更准确。这还不够好。
AI检测的未来
谷歌的最新工具描绘了一条潜在的前进道路,即使它的功能有限。是的,解决日益严重的深度伪造问题的一个解决方案是在聊天机器人应用中具备检查图像的能力。但它需要适用于更多图像和更多应用。
识别假图不应该需要专门知识。你不应该必须找到专门的应用程序、解析元数据或随口知道哪些错误可能表明AI生成的图像。正如我们在过去几个月中从图像和视频模型的显著改进中看到的,这些痕迹今天可能是万无一失的,明天就可能无用了。
如果你在互联网上遇到一张图片并对它有疑问,你应该能够转到Gemini、谷歌搜索、ChatGPT、Claude或你选择的任何工具,让它扫描通用的、难以移除的数字水印。通过内容来源和认证联盟(C2PA)正在朝这个方向努力。结果应该是让普通人能够轻松检查,而不需要专门的应用程序或专业知识。它应该在你每天使用的工具中可用。当你问AI时,它应该知道在哪里寻找。
我们不应该必须猜测什么是真实的,什么不是。AI公司有责任给我们一个万无一失的、通用的现实检查。也许这是一条前进的道路。
Q&A
Q1:什么是SynthID?它是如何工作的?
A:SynthID是谷歌开发的数字水印技术,用于标记AI生成的内容。当Gemini检查图像时,它会寻找这种水印来确定图像是否由谷歌的AI工具制作。在有限的范围内,这种技术工作得相当好,能够快速准确地识别谷歌AI生成的图像。
Q2:为什么不同的AI聊天机器人对同一张图片会给出不同的判断结果?
A:因为当图像缺乏数字水印时,AI模型只能基于视觉线索进行判断,比如光照不匹配、文本渲染不佳等。但这种方法不够可靠,就像人眼观察一样存在主观性。测试显示,即使是同一个模型在不同时间也可能给出截然不同的答案。
Q3:如何才能更好地识别AI生成的图像?
A:理想的解决方案是建立一个通用的数字水印系统,让所有AI工具生成的图像都带有难以移除的标记。内容来源和认证联盟正在努力实现这一目标。这样,普通用户就可以在日常使用的工具中轻松检查图像真实性,而不需要专门知识或特殊应用程序。
好文章,需要你的鼓励
随着沃尔玛电商部门年化GMV突破1000亿美元,AI驱动的商务正在加速发展。Onton获得由Footwork领投的种子轮融资,定位为电商决策的起点。该平台通过神经符号引擎解决传统电商搜索痛点,在家居装饰领域快速扩张,月活用户从5万增长至100万。沃尔玛和好市多等零售巨头已在运用AI重塑购物体验,消费者期望正在发生根本性转变。
中科大联合快手等机构推出VR-Thinker技术,首次实现AI视频评判员的"边看边想"能力。该系统通过主动选择关键画面、智能记忆管理和三阶段训练,在视频质量评估准确率上达到75%-82%,特别擅长处理长视频场景,为AI视频生成的质量控制提供了突破性解决方案。
卫星连接领域领军企业星链与BICS达成战略合作,指定Proximus Global为其在欧洲直连手机卫星服务的首选IPX提供商。该合作将使星链利用现有IPX网络连接移动运营商,并为能够向智能手机提供宽带服务的下一代网络铺平道路。星链直连手机服务拥有超过650颗低轨卫星,可在移动信号盲区提供数据、语音、视频和消息服务,连接五大洲超800万用户。
微软研究院发布BitDistill技术,通过三阶段优化将大型语言模型压缩至1.58位精度,在保持性能的同时实现10倍内存节省和2.65倍速度提升。该技术包括模型结构稳定化、持续预训练适应和知识蒸馏传承三个关键步骤,解决了模型量化中的性能衰减和规模化问题,为AI模型在资源受限设备上的高效部署提供了新方案。