YouTube周二宣布,将其用于识别AI生成深度伪造内容的相似性检测技术扩展至试点群体,包括政府官员、政治候选人和新闻工作者。试点群体成员将获得一个工具,该工具可以检测未经授权的AI生成内容,如果他们认为内容违反了YouTube政策,可以请求删除。
该技术于去年面向约400万名YouTube合作伙伴计划的创作者推出,此前经过了早期测试。
与YouTube现有的Content ID系统类似,相似性检测功能会寻找使用AI工具制作的模拟面孔。Content ID系统用于检测用户上传视频中受版权保护的材料。这些AI工具有时被用来传播错误信息和操纵人们对现实的认知,因为它们利用政治家或其他政府官员等知名人物的深度伪造形象,在AI视频中说出和做出他们在现实生活中从未说过或做过的事情。
通过这个新的试点项目,YouTube旨在平衡用户的言论自由与能够生成公众人物逼真形象的AI技术所带来的风险。
YouTube政府事务和公共政策副总裁莱斯利·米勒在周二发布前的新闻发布会上说:"这次扩展真正关乎公共对话的完整性。我们知道AI冒充对那些在公民领域工作的人来说风险特别高。但是,虽然我们提供这种新的保护,我们在使用时也很谨慎。"
米勒解释说,并非所有检测到的匹配内容在被请求时都会被删除。相反,YouTube会根据其现有的隐私政策指导原则评估每个请求,以确定内容是否为受保护的言论自由形式,如恶搞或政治批评。
该公司指出,它也在联邦层面倡导这些保护措施,支持华盛顿的NO FAKES法案,该法案将规范使用AI创建未经授权的个人语音和视觉形象再现。
要使用新工具,符合条件的试点测试者必须首先通过上传自拍照和政府身份证明来证明身份。然后他们可以创建个人资料,查看出现的匹配内容,并可选择请求删除。YouTube表示,计划最终给人们提供在违规内容上线前阻止上传的能力,或者可能允许他们从这些视频中获利,类似于Content ID系统的工作方式。
该公司不会确认哪些政治家或官员将成为首批测试者,但表示目标是随着时间推移使该技术广泛可用。
这些AI视频将被标记,但标签的位置并不一致。对于某些视频,标签出现在视频描述中,而专注于更"敏感话题"的视频会在视频前面应用标签。这与YouTube处理所有AI生成内容的方法相同。
YouTube创作者产品副总裁阿姆贾德·哈尼夫解释标签位置时说:"有很多内容是用AI制作的,但这种区别实际上对内容本身并不重要。可能是用AI生成的卡通。所以我认为需要判断是否是需要非常明显免责声明的类别。"
YouTube目前没有分享通过这种深度伪造检测技术在创作者手中管理的此类AI深度伪造内容删除数量,但指出到目前为止删除的内容量"非常少"。
哈尼夫说:"我认为对于很多[创作者]来说,这只是对正在创建的内容的认知,但实际删除请求的数量非常非常低,因为大部分结果都是相当良性的或对他们的整体业务有益的。"
对于政府官员、政治家或新闻工作者的深度伪造内容,情况可能有所不同。
随着时间推移,YouTube打算将其深度伪造检测技术扩展到更多领域,包括可识别的说话声音和其他知识产权,如热门角色。
Q&A
Q1:YouTube的AI深度伪造检测技术是什么?
A:YouTube的AI深度伪造检测技术是一种相似性检测工具,能够识别使用AI工具制作的模拟面孔和深度伪造内容。该技术类似于YouTube现有的Content ID系统,可以检测未经授权的AI生成内容,帮助用户请求删除违反平台政策的深度伪造视频。
Q2:哪些人可以使用YouTube的深度伪造检测试点项目?
A:目前试点项目面向政府官员、政治候选人和新闻工作者开放。符合条件的测试者需要通过上传自拍照和政府身份证明来验证身份,然后可以创建个人资料,查看检测到的匹配内容,并可选择请求删除违规内容。
Q3:YouTube如何处理AI生成内容的标签和删除请求?
A:YouTube会在AI生成的视频上添加标签,但位置不一致。普通内容的标签出现在描述中,敏感话题的标签会在视频前面显示。对于删除请求,YouTube会根据隐私政策指导原则评估每个请求,确定内容是否为受保护的言论自由形式,如恶搞或政治批评。
好文章,需要你的鼓励
Converge Bio完成550万美元种子轮融资,由TLV Partners领投。该公司专为生物科技和制药行业打造LLM应用平台,提供数据增强、模型微调及可解释性分析等功能,帮助企业将通用生物基础模型转化为可实际落地的研发工具。以抗体研究为例,平台可将抗体LLM精调至氨基酸级别的结合亲和力预测,并生成优化序列。公司计划用于扩充团队、拓展客户,并发布抗体设计科研论文。
香港大学与哈尔滨工业大学联合发布的这项研究(arXiv:2605.06196)发现,大语言模型在扮演不同社会层级角色时,内部神经网络存在一条清晰的"粒度轴",从普通个人视角延伸至全球机构视角。这条轴是AI角色空间的主导几何方向,可被测量、被跨模型复现,并通过激活引导技术加以操控,为AI社会模拟的可信度评估和角色视角的主动调控提供了新工具。
ChatGPT高级语音模式的创造者Alexis Conneau离开OpenAI后,创办了音频AI初创公司WaveForms AI,并获得由a16z领投的4000万美元种子轮融资。该公司专注于训练自有音频大语言模型,计划于2025年推出与OpenAI、谷歌竞争的AI音频产品。Conneau深受电影《Her》启发,致力于开发具备情感感知能力的语音AI,同时警惕AI伴侣化带来的社会问题,强调技术应服务于人而非取代人际关系。
华盛顿大学研究团队发现,在AI数学推理训练中,将随机拼凑的拉丁文占位词(Lorem Ipsum)添加到题目前,能帮助AI突破"全部答错、训练停滞"的困境,在多个模型上平均提升推理得分2.8至6.2分。研究揭示了有效扰动的两个关键特征:使用拉丁语词汇避免语义干扰,以及保持较低困惑度确保AI能正确理解题目内容。