每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

OpenFake:面向现实世界 Deepfake 检测的开放数据集和平台

Created by
  • Haebom

作者

维克多·利弗诺什、阿克沙塔·阿罗迪、安德烈亚·穆苏兰、扎卡里·杨、亚当·萨尔维尔、盖坦·马索·卡隆、让-弗朗索瓦·戈布特、雷哈内·拉巴尼

OpenFake:用于 Deepfake 检测的大规模数据集和基准

大纲

本文重点介绍了深度伪造(DeepFake,即利用人工智能生成的合成媒体)对信息真实性构成的威胁,并强调其在政治敏感环境下日益增长的危险性。随着现代生成模型真实性的提升,超越人类认知能力的深度伪造正在涌现。为了克服现有深度伪造检测基准(这些基准依赖于过时的生成器或狭窄的数据集)的局限性,本文提出了 OpenFake,这是一个专为对具有高真实度的先进生成模型进行基准测试而设计的大规模政治数据集。OpenFake 包含约 400 万张图像,其中包括 300 万张带有详细描述的真实图像,以及约 100 万张由最先进的专有和开源模型生成的合成图像。在 OpenFake 上训练的检测器实现了近乎完美的分布内性能,对未知生成器表现出强大的泛化能力,并在真实社交媒体测试集上实现了高精度,显著优于在现有数据集上训练的模型。总之,我们通过高质量、持续更新的基准证明了自动深度伪造检测在现实世界环境中是可行且有效的。

Takeaways, Limitations

Takeaways:
我们强调了在政治背景下深度伪造检测的重要性,并为现实的深度伪造检测提供了新的数据集和基准。
OpenFake 采用最先进的生成模型构建,并利用创新的众包平台进行持续扩展。
在 OpenFake 上训练的检测器的性能优于现有数据集。
高质量的基准测试证明了在现实环境中深度伪造检测的可行性。
Limitations:
该论文可能缺乏技术细节或特定深度伪造检测模型背后算法的深入解释。
众包平台的持续维护和管理的难度。
数据集中可能存在偏见并暴露特定的政治倾向。
缺乏创建和维护数据集所需的资源和成本的描述。
👍