Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

DATABench: Evaluación de la auditoría de conjuntos de datos en aprendizaje profundo desde una perspectiva adversarial

Created by
  • Haebom

Autor

Shuo Shao, Yiming Li, Mengren Zheng, Zhiyang Hu, Yukun Chen, Boheng Li, Yu He, Junfeng Guo, Dacheng Tao, Zhan Qin

Describir

Este artículo estudia técnicas de auditoría de conjuntos de datos para abordar problemas de privacidad y derechos de autor derivados de la falta de transparencia en los conjuntos de datos utilizados en el entrenamiento de modelos de aprendizaje profundo. Analizamos las vulnerabilidades de las técnicas existentes de auditoría de conjuntos de datos a ataques adversarios y proponemos un nuevo sistema de clasificación que las categoriza en métodos basados ​​en características internas (IF) y características externas (EF). Además, definimos dos tipos principales de ataque: ataques de evasión, que ocultan el uso de conjuntos de datos, y ataques de falsificación, que reclaman falsamente conjuntos de datos no utilizados. Proponemos estrategias de ataque sistemáticas para cada tipo (separación, eliminación y detección para ataques de evasión; métodos adversarios basados ​​en ejemplos para ataques de falsificación). Finalmente, presentamos un nuevo punto de referencia, DATABench, compuesto por 17 ataques de evasión, cinco ataques de falsificación y nueve técnicas de auditoría representativas. Los resultados de nuestra evaluación demuestran que las técnicas de auditoría existentes no son lo suficientemente robustas o discriminatorias en entornos adversarios.

Takeaways, Limitations

Takeaways:
Analizamos sistemáticamente la vulnerabilidad de las técnicas de auditoría de conjuntos de datos a ataques adversarios y proporcionamos un nuevo punto de referencia, DATABench, que sugiere futuras direcciones de investigación.
Proponemos un nuevo sistema de clasificación que clasifica las técnicas de auditoría existentes en función de características internas (CI) y características externas (FE).
Presentamos una estrategia de ataque sistemático contra ataques de evasión y falsificación.
Limitations:
Si bien demuestra que las técnicas actuales de auditoría de conjuntos de datos son vulnerables a ataques adversarios, no ofrece soluciones específicas para desarrollar técnicas de auditoría más sólidas y confiables.
Los tipos de ataques y técnicas de auditoría incluidos en DATABench podrían ser limitados. Las futuras pruebas de rendimiento deberían ampliarse para incluir una gama más amplia de ataques y técnicas de auditoría.
👍