短短几年间,AI生成内容已从容易识别的"多指图像",进化为几乎以假乱真的高度逼真影像和视频。在AI技术飞速发展的今天,如何判断内容的真实性?Google给出的答案是SynthID。
这项技术最初于三年前亮相,如今Google披露,SynthID已被用于标记超过1000亿张图片和视频,以及累计长达6万年的音频内容。随着SynthID向Google生态圈以外持续扩展,这一数字还将继续攀升。
SynthID并非Google唯一的AI内容标记方案。Google同样支持C2PA标准,该标准通过在内容中嵌入元数据来说明其创建方式。此前,Google已在Pixel 10系列智能手机中率先引入C2PA,用户使用Pixel 10拍摄的照片将自动附带处理方式的元数据说明,若图片包含生成式AI元素,还会被额外添加AI标签。
Google近日宣布,上述功能将通过后续更新延伸至Pixel 8、9及10系列手机拍摄的视频内容。与此同时,C2PA扫描功能也将整合进Gemini,使其能够根据内容标签向用户解释文件的来源信息。该功能还将在未来数月内推广至Chrome浏览器和Google搜索。
不过,元数据存在可被篡改的隐患。相比之下,SynthID与AI生成内容的结合更为深层:数字水印直接嵌入图片和视频的像素层,以及NotebookLM等产品输出的AI歌曲和音频摘要的波形数据中。据Google DeepMind科学家Pushmeet Kohli介绍,研究团队投入了大量精力,确保SynthID在经过压缩、裁剪或旋转等处理后依然难以去除。
"这类技术必然会面临各种攻击,"Kohli表示,"我们在提升SynthID应对不同类型处理方式的鲁棒性上进行了大量研究。"
去年,Google在Gemini应用中新增了SynthID检测功能,用户可上传可疑内容,直接询问Gemini该内容是否由AI生成,这对过去三年间数以亿计的Google AI图像和音频内容均有良好的识别效果。尽管部分技术爱好者声称找到了去除SynthID隐藏水印的方法,但Google坚持认为,目前没有任何绕过方案真正有效。
SynthID走向更广泛的应用场景
即便SynthID目前尚无人能够破解,对于互联网上绝大多数AI图像而言,这一优势的意义仍然有限——毕竟目前只有Google的AI模型会应用SynthID。但这一局面即将改变。
Google宣布已与多家公司达成合作,将SynthID引入其各自的系统。英伟达将在其Cosmos世界基础模型中实装SynthID,OpenAI则会在GPT 2图像中采用该技术;Kakao和ElevenLabs也将陆续为其AI生成内容添加SynthID标记。
当然,这并不意味着所有AI内容都能被识别。目前市面上仍有大量开源模型可供任何人自由使用,生成不带任何AI水印的内容。但无论如何,此次合作无疑是朝着正确方向迈出的重要一步。
在检测渠道方面,Google也在积极拓展。未来用户无需专门打开Gemini,即可查验SynthID水印状态。SynthID将整合进Circle to Search、Google Lens及AI Mode等工具。用户还可以通过在Chrome中共享标签页的方式调用Gemini,只需输入"这是AI生成的吗"等类似问题,即可触发SynthID扫描。
目前,SynthID暂不对外提供公开API——若扫描功能过于便捷,反而可能成为被绕过的攻击入口。不过,Google正积极筹备在Gemini企业智能体平台中推出AI内容检测API,让可信赖的企业合作伙伴更高效地标记AI内容,同时持续优化API的性能与体验。
Q&A
Q1:SynthID是什么技术?它如何标记AI内容?
A:SynthID是Google开发的AI数字水印技术,用于标记AI生成的图像、视频和音频内容。它将水印直接嵌入图片和视频的像素层,以及音频的波形数据中,即便内容经过压缩、裁剪或旋转等处理,水印依然难以去除。目前SynthID已被用于标记超过1000亿张图片和视频,以及约6万年时长的音频内容。
Q2:哪些公司正在采用SynthID技术?
A:Google已宣布与多家公司达成合作,推动SynthID更广泛落地。英伟达将在Cosmos世界基础模型中实装SynthID,OpenAI将在GPT 2图像生成中采用该技术,韩国互联网公司Kakao和AI语音平台ElevenLabs也将为其AI生成内容添加SynthID水印标记。
Q3:普通用户如何检测内容是否含有SynthID水印?
A:普通用户可通过多种方式检测SynthID水印。目前可在Gemini应用中上传可疑内容并直接询问是否为AI生成。未来SynthID还将整合至Google的Circle to Search、Google Lens及AI Mode等工具,用户在Chrome浏览器中也可通过共享标签页的方式调用Gemini进行检测,只需提问"这是AI生成的吗"即可完成扫描。
好文章,需要你的鼓励
Anthropic首次将其最强AI模型向普通用户开放,但设有严格安全限制。Claude Fable 5在软件工程、知识工作和视觉任务方面表现突出,但在网络安全、生物、化学等高风险领域会自动屏蔽响应并回退至Claude Opus 4.8。该模型通过API和企业计划提供访问,定价为每百万输入令牌10美元、输出令牌50美元。Anthropic同时要求对所有流量保留30天数据,以防范新型越狱攻击。
香港科技大学等机构构建SpatialAct基准,测试视觉语言模型能否在3D场景中将空间理解转化为可靠行动,揭示AI存在显著的推理与行动鸿沟。
根据Salesforce与YouGov联合调查,美国工人比全球平均水平高出43%成为AI怀疑者,超过半数美国工人对AI持怀疑态度。与印度、泰国等新兴经济体80%以上的AI信任度相比,美国仅约50%。原因不仅在于担忧失业,还包括AI工具输出质量差、培训不足及数据基础薄弱等问题。研究显示,成功的AI应用需要高质量数据、员工培训与实验文化的共同支撑。
这项研究发现AI统一多模态模型中存在显著"模态鸿沟":文字知识编辑成功率高达92%,但图像生成验证准确率最高仅18.5%,并提出推理增强方法改善跨模态知识传递。