短短几年间,AI生成内容已从容易识别的"多指图像",进化为几乎以假乱真的高度逼真影像和视频。在AI技术飞速发展的今天,如何判断内容的真实性?Google给出的答案是SynthID。
这项技术最初于三年前亮相,如今Google披露,SynthID已被用于标记超过1000亿张图片和视频,以及累计长达6万年的音频内容。随着SynthID向Google生态圈以外持续扩展,这一数字还将继续攀升。
SynthID并非Google唯一的AI内容标记方案。Google同样支持C2PA标准,该标准通过在内容中嵌入元数据来说明其创建方式。此前,Google已在Pixel 10系列智能手机中率先引入C2PA,用户使用Pixel 10拍摄的照片将自动附带处理方式的元数据说明,若图片包含生成式AI元素,还会被额外添加AI标签。
Google近日宣布,上述功能将通过后续更新延伸至Pixel 8、9及10系列手机拍摄的视频内容。与此同时,C2PA扫描功能也将整合进Gemini,使其能够根据内容标签向用户解释文件的来源信息。该功能还将在未来数月内推广至Chrome浏览器和Google搜索。
不过,元数据存在可被篡改的隐患。相比之下,SynthID与AI生成内容的结合更为深层:数字水印直接嵌入图片和视频的像素层,以及NotebookLM等产品输出的AI歌曲和音频摘要的波形数据中。据Google DeepMind科学家Pushmeet Kohli介绍,研究团队投入了大量精力,确保SynthID在经过压缩、裁剪或旋转等处理后依然难以去除。
"这类技术必然会面临各种攻击,"Kohli表示,"我们在提升SynthID应对不同类型处理方式的鲁棒性上进行了大量研究。"
去年,Google在Gemini应用中新增了SynthID检测功能,用户可上传可疑内容,直接询问Gemini该内容是否由AI生成,这对过去三年间数以亿计的Google AI图像和音频内容均有良好的识别效果。尽管部分技术爱好者声称找到了去除SynthID隐藏水印的方法,但Google坚持认为,目前没有任何绕过方案真正有效。
SynthID走向更广泛的应用场景
即便SynthID目前尚无人能够破解,对于互联网上绝大多数AI图像而言,这一优势的意义仍然有限——毕竟目前只有Google的AI模型会应用SynthID。但这一局面即将改变。
Google宣布已与多家公司达成合作,将SynthID引入其各自的系统。英伟达将在其Cosmos世界基础模型中实装SynthID,OpenAI则会在GPT 2图像中采用该技术;Kakao和ElevenLabs也将陆续为其AI生成内容添加SynthID标记。
当然,这并不意味着所有AI内容都能被识别。目前市面上仍有大量开源模型可供任何人自由使用,生成不带任何AI水印的内容。但无论如何,此次合作无疑是朝着正确方向迈出的重要一步。
在检测渠道方面,Google也在积极拓展。未来用户无需专门打开Gemini,即可查验SynthID水印状态。SynthID将整合进Circle to Search、Google Lens及AI Mode等工具。用户还可以通过在Chrome中共享标签页的方式调用Gemini,只需输入"这是AI生成的吗"等类似问题,即可触发SynthID扫描。
目前,SynthID暂不对外提供公开API——若扫描功能过于便捷,反而可能成为被绕过的攻击入口。不过,Google正积极筹备在Gemini企业智能体平台中推出AI内容检测API,让可信赖的企业合作伙伴更高效地标记AI内容,同时持续优化API的性能与体验。
Q&A
Q1:SynthID是什么技术?它如何标记AI内容?
A:SynthID是Google开发的AI数字水印技术,用于标记AI生成的图像、视频和音频内容。它将水印直接嵌入图片和视频的像素层,以及音频的波形数据中,即便内容经过压缩、裁剪或旋转等处理,水印依然难以去除。目前SynthID已被用于标记超过1000亿张图片和视频,以及约6万年时长的音频内容。
Q2:哪些公司正在采用SynthID技术?
A:Google已宣布与多家公司达成合作,推动SynthID更广泛落地。英伟达将在Cosmos世界基础模型中实装SynthID,OpenAI将在GPT 2图像生成中采用该技术,韩国互联网公司Kakao和AI语音平台ElevenLabs也将为其AI生成内容添加SynthID水印标记。
Q3:普通用户如何检测内容是否含有SynthID水印?
A:普通用户可通过多种方式检测SynthID水印。目前可在Gemini应用中上传可疑内容并直接询问是否为AI生成。未来SynthID还将整合至Google的Circle to Search、Google Lens及AI Mode等工具,用户在Chrome浏览器中也可通过共享标签页的方式调用Gemini进行检测,只需提问"这是AI生成的吗"即可完成扫描。
好文章,需要你的鼓励
Locus Robotics宣布收购加拿大温哥华机器人公司Nexera Robotics,将其专有的NeuraGrasp末端执行器技术整合至Locus Array平台。NeuraGrasp融合AI抓取智能、计算机视觉及专利软膜结构,可动态适应不同形状、材质、重量的商品,显著扩大了可自主拣选的SKU类型范围。此次收购将加速Locus Robotics在移动操控领域的技术路线图,推动仓储全流程自动化履约能力迈上新台阶。
ServiceNow研究团队构建的EVA-Bench框架,通过AI对AI的音频通话测试,量化评估语音客服系统在准确性和对话体验两个维度的真实表现,揭示现有系统普遍存在的可靠性缺口。
人形机器人正从原型验证迈向早期商业部署,汽车制造与物流领域预计成为未来十年核心需求市场。IDTechEx预测,相关市场规模将于2030年代初达到约250亿美元,2036年年出货量接近180万台。硬件成本持续下降,均价有望从2024年的约11.47万美元降至2030年的约3.7万美元。高利用率场景下运营成本有望低于5美元/小时,投资回收期可缩短至约6个月。但大规模商业化的关键,仍在于软件能力、任务泛化与系统集成的持续突破。
AWS AI Labs研究团队发布EvalAgent,这是一套通过"评估技能"自动生成AI智能体评测方案的系统,将首次运行成功率从17.5%提升至65%,并在人类专家评测中获得79.5%的偏好选择。