短短几年间,AI生成内容已从容易识别的"多指图像",进化为几乎以假乱真的高度逼真影像和视频。在AI技术飞速发展的今天,如何判断内容的真实性?Google给出的答案是SynthID。
这项技术最初于三年前亮相,如今Google披露,SynthID已被用于标记超过1000亿张图片和视频,以及累计长达6万年的音频内容。随着SynthID向Google生态圈以外持续扩展,这一数字还将继续攀升。
SynthID并非Google唯一的AI内容标记方案。Google同样支持C2PA标准,该标准通过在内容中嵌入元数据来说明其创建方式。此前,Google已在Pixel 10系列智能手机中率先引入C2PA,用户使用Pixel 10拍摄的照片将自动附带处理方式的元数据说明,若图片包含生成式AI元素,还会被额外添加AI标签。
Google近日宣布,上述功能将通过后续更新延伸至Pixel 8、9及10系列手机拍摄的视频内容。与此同时,C2PA扫描功能也将整合进Gemini,使其能够根据内容标签向用户解释文件的来源信息。该功能还将在未来数月内推广至Chrome浏览器和Google搜索。
不过,元数据存在可被篡改的隐患。相比之下,SynthID与AI生成内容的结合更为深层:数字水印直接嵌入图片和视频的像素层,以及NotebookLM等产品输出的AI歌曲和音频摘要的波形数据中。据Google DeepMind科学家Pushmeet Kohli介绍,研究团队投入了大量精力,确保SynthID在经过压缩、裁剪或旋转等处理后依然难以去除。
"这类技术必然会面临各种攻击,"Kohli表示,"我们在提升SynthID应对不同类型处理方式的鲁棒性上进行了大量研究。"
去年,Google在Gemini应用中新增了SynthID检测功能,用户可上传可疑内容,直接询问Gemini该内容是否由AI生成,这对过去三年间数以亿计的Google AI图像和音频内容均有良好的识别效果。尽管部分技术爱好者声称找到了去除SynthID隐藏水印的方法,但Google坚持认为,目前没有任何绕过方案真正有效。
SynthID走向更广泛的应用场景
即便SynthID目前尚无人能够破解,对于互联网上绝大多数AI图像而言,这一优势的意义仍然有限——毕竟目前只有Google的AI模型会应用SynthID。但这一局面即将改变。
Google宣布已与多家公司达成合作,将SynthID引入其各自的系统。英伟达将在其Cosmos世界基础模型中实装SynthID,OpenAI则会在GPT 2图像中采用该技术;Kakao和ElevenLabs也将陆续为其AI生成内容添加SynthID标记。
当然,这并不意味着所有AI内容都能被识别。目前市面上仍有大量开源模型可供任何人自由使用,生成不带任何AI水印的内容。但无论如何,此次合作无疑是朝着正确方向迈出的重要一步。
在检测渠道方面,Google也在积极拓展。未来用户无需专门打开Gemini,即可查验SynthID水印状态。SynthID将整合进Circle to Search、Google Lens及AI Mode等工具。用户还可以通过在Chrome中共享标签页的方式调用Gemini,只需输入"这是AI生成的吗"等类似问题,即可触发SynthID扫描。
目前,SynthID暂不对外提供公开API——若扫描功能过于便捷,反而可能成为被绕过的攻击入口。不过,Google正积极筹备在Gemini企业智能体平台中推出AI内容检测API,让可信赖的企业合作伙伴更高效地标记AI内容,同时持续优化API的性能与体验。
Q&A
Q1:SynthID是什么技术?它如何标记AI内容?
A:SynthID是Google开发的AI数字水印技术,用于标记AI生成的图像、视频和音频内容。它将水印直接嵌入图片和视频的像素层,以及音频的波形数据中,即便内容经过压缩、裁剪或旋转等处理,水印依然难以去除。目前SynthID已被用于标记超过1000亿张图片和视频,以及约6万年时长的音频内容。
Q2:哪些公司正在采用SynthID技术?
A:Google已宣布与多家公司达成合作,推动SynthID更广泛落地。英伟达将在Cosmos世界基础模型中实装SynthID,OpenAI将在GPT 2图像生成中采用该技术,韩国互联网公司Kakao和AI语音平台ElevenLabs也将为其AI生成内容添加SynthID水印标记。
Q3:普通用户如何检测内容是否含有SynthID水印?
A:普通用户可通过多种方式检测SynthID水印。目前可在Gemini应用中上传可疑内容并直接询问是否为AI生成。未来SynthID还将整合至Google的Circle to Search、Google Lens及AI Mode等工具,用户在Chrome浏览器中也可通过共享标签页的方式调用Gemini进行检测,只需提问"这是AI生成的吗"即可完成扫描。
好文章,需要你的鼓励
美国连锁超市巨头Albertsons正在基于Databricks构建商品智能平台,整合产品、定价、促销与陈列等决策功能,目标是在2026年底前全面向门店运营商落地。该平台以Databricks Lakehouse存储零售数据,通过Unity Catalog与AI Gateway实现数据治理,并借助AI智能体Genie支持自然语言查询,帮助商家洞察销售趋势,提升决策效率。此举是Albertsons今年四项AI核心战略投资之一。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
微软正将Windows 11打造成真正的AI操作系统。在Build大会上,微软展示了AI模型与智能代理如何深度融合进Windows 11,让用户通过自然语言完成系统操作。借助Windows ML框架,超过5亿台PC已可在本地离线运行AI任务,无需联网、无token费用、数据不离设备。Office、Photos、Teams等应用已支持本地AI能力,Adobe、WhatsApp、Canva等第三方也在积极跟进,企业级AI PC采购需求有望加速。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。