微软联合高校推出深度伪造检测数据集，助力生成式AI内容鉴别

微软、西北大学和非营利组织Witness联合推出名为MNW的深度伪造检测基准数据集，旨在帮助构建更强大的AI生成内容检测系统。该数据集涵盖来自多种生成器的多样化AI媒体样本，并包含经过裁剪、压缩等后处理的内容，以贴近真实场景。团队计划每年春秋两季更新数据集，以应对生成式AI的快速演进，提升检测器在现实环境中的泛化能力。

随着AI生成内容在网络上的大量涌现，帮助公众识别图像、音频或视频真伪的工作变得愈发困难，也愈发重要。为应对这一挑战，来自微软、美国西北大学以及非营利组织Witness的研究人员携手合作，共同构建了一个全新的AI生成媒体数据集，旨在帮助开发更加强健的深度伪造检测系统。Witness长期致力于协助活动人士和记者应对AI生成内容带来的各类挑战。

研究团队将这一新数据集命名为微软-西北大学-Witness深度伪造检测基准（MNW），相关研究成果已于4月10日发表在IEEE Intelligent Systems期刊上。该数据集在构建时刻意纳入了多样化的AI生成媒体样本，以尽可能真实地反映当前生成式AI的发展全貌。

微软首席研究科学家Thomas Roca专注于生成式AI安全领域的研究。他指出，生成式AI所产出的媒体质量正在持续提升，如今几乎任何人只需借助手机上的一款应用，便能生成模仿他人声音的语音消息，或伪造他人外貌的图像与视频。

此类虚假媒体所造成的危害十分深远，涵盖身份欺诈、诈骗，乃至生成未经当事人同意的私密影像，甚至儿童性虐待材料。

然而，AI生成工具并非无懈可击。在生成视频、图像或音频时，它们会留下所谓的"痕迹"——一些细微的信号或印记，可作为内容造假的佐证。"这些痕迹可能包括噪声分布异常、像素块之间的不一致性、音频信号中的断裂，以及其他各类不规则现象。"Roca说道。

当前检测面临的挑战

全球各地的研究团队一直在开发检测器，其本质上是经过训练、能够识别AI生成媒体中痕迹的AI模型。然而，这场检测与生成之间的军备竞赛中，生成工具始终占据上风。

"视频、图像和音频的真实性认定对社会来说至关重要，但现有检测系统尚未能胜任这一挑战。"Roca表示，"我们认为，这在一定程度上源于这些系统的评估方式存在问题。"

举例而言，研究人员可能会使用来自少数几个生成器的大量AI内容样本来训练检测器，但这样的检测器往往难以有效应对新生成的内容。生成式AI的迭代速度极快，这一问题因此愈发突出。

正因如此，这些检测系统在面对训练数据集或成熟基准测试时表现尚可，但在真实环境中却往往差强人意。"实验室里的AI不等于现实世界中的AI。"Roca如是说。

MNW基准的构建思路

为了更全面地应对上述挑战，微软、西北大学和Witness的专家联合开发了MNW基准。"这三方视角——学术界、产业界与面向实地的非营利组织——共同构成了一套更完整的方法论。单凭任何一方，都无法独立完成这项工作。"西北大学博士后研究员Marco Postiglione说道。

该数据集旨在汇集来自不同生成器的多样化AI生成素材，以提升检测器在真实场景中的适用性。

Postiglione指出，网络上的虚假视频、音频和图像通常已经过后处理操作，例如调整尺寸、裁剪和压缩。此外，也有人会刻意对内容进行处理，使其更难被检测到。

MNW团队致力于提供涵盖不同生成器、经历不同后处理操作的最全面样本集，以确保该数据集能够充分代表当前生成式AI的整体面貌。团队还计划每年春秋两季对数据集进行更新，以体现最新的生成器痕迹特征，以及试图规避检测系统的各类新手段。

研究人员也坦承，尽管该数据集的初衷是帮助开发者对其检测器进行基准测试，但不排除有人将其用于探索规避检测的新方法。尽管如此，他们仍认为应对深度伪造内容是当务之急。

"MNW的目标是为这项共同努力贡献力量——提升行业标准，推动透明度，并确保随着生成式AI的持续发展，我们评估内容真实性的能力也能同步跟上。"Roca说道。

Q&A

Q1：MNW深度伪造检测基准数据集是什么？有什么特别之处？

A：MNW是由微软、西北大学和非营利组织Witness联合构建的深度伪造检测基准数据集，全称为Microsoft-Northwestern-Witness。它的特别之处在于纳入了来自多种生成器的多样化AI媒体样本，并涵盖了调整尺寸、裁剪、压缩等各类后处理操作的内容，更贴近真实网络环境。此外，团队每年春秋两季更新数据集，以紧跟最新生成器技术的发展。

Q2：现有的深度伪造检测系统为什么在现实中表现不佳？

A：主要原因在于训练数据来源单一，研究人员通常只用少数几个生成器的样本来训练检测器，导致模型泛化能力不足，难以应对来自新生成器或经过后处理的内容。加之生成式AI迭代速度极快，检测系统的更新跟不上生成工具的进化节奏，使得在实验室环境中表现良好的系统在真实场景下往往力不从心。

Q3：AI生成内容中的"痕迹"具体指什么？

A：痕迹是指AI在生成图像、视频或音频时无意间留下的细微异常特征，可作为判断内容为AI生成的依据。这些痕迹包括：图像中的噪声分布异常、像素块之间存在不一致性、音频信号出现断裂或间隙，以及其他各类难以被肉眼察觉的不规则现象。检测器正是通过学习识别这些痕迹来判断媒体内容的真伪。

来源：Spectrum

0赞

好文章，需要你的鼓励

微软联合高校推出深度伪造检测数据集，助力生成式AI内容鉴别

来源：Spectrum

2026

05/07

12:09

分享

点赞

立中集团泰国第三工厂扩产铝合金车轮，800 万只铸造产能接近成形

SAP 2026年蓝宝石大会：CEO承认AI战略曾走弯路，全面转向业务自主化【正常】

NHS单一患者电子档案或每年减少两万次急诊就诊并节省两千万英镑【正常】

苹果智能眼镜据报道推迟至2027年底发布

2026年第一季度Mac恶意软件威胁态势全面回顾【正常】

AI的冷漠与空洞：它的乏味之声为何契合当下政治氛围【正常】

苹果新版Apple TV与HomePod mini将于今秋发布，Siri遥控器或迎来更新

从被动响应到自主运营：IT领导者下一步该怎么做【正常】

苹果AI智能眼镜延迟至2027年底发布，Vision Air最早2029年亮相

真正改善日常生活的家居AI功能盘点

"心灵子嗣"会是人类繁殖的未来吗？

水资源成为AI数据中心扩张的新瓶颈【正常】

推理计算给AI芯片初创企业带来新的突围机会

在AI时代，人类智能是否仍然独一无二？

Uber计划将数百万名司机变成自动驾驶数据采集网络

AI分析发现霍尔拜因肖像中的神秘人物或为安妮·博林

Atlassian大举抢占市场，ServiceNow腹背受敌

这个AI知道答案，却不懂问题的含义

按量计费模式成本飙升？教你搭建本地AI编程智能体

AWS三大AI战略重磅发布：OpenAI合作升级、智能体矩阵扩张、个人助手登场

SAS将AI治理置于智能体战略核心位置

研究发现：注重用户情感的AI模型更容易出错

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: