Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

MIA-EPT: Ataque de inferencia de membresía mediante predicción de errores para datos tabulares

Created by
  • Haebom

Autor

Eyal German, Daniel Samira, Yuval Elovici, Asaf Shabtai

MIA-EPT: Ataque de inferencia de membresía mediante predicción de errores para datos tabulares

Describir

Este artículo destaca la importancia de la generación de datos sintéticos para el intercambio de datos sensibles y analiza las vulnerabilidades de los modelos de difusión que generan datos tabulares. En concreto, señala que los ataques de inferencia de membresía (MIA) pueden permitir que los modelos memoricen datos de entrenamiento y filtren información sensible. MIA-EPT es un novedoso ataque de caja negra especializado en datos tabulares que enmascara y reconstruye atributos para construir vectores de características basados ​​en errores que revelan señales de pertenencia. MIA-EPT demuestra su generalización en múltiples modelos de difusión utilizando únicamente datos sintéticos como salida, obteniendo el segundo puesto en la competición MIDST 2025.

Takeaways, Limitations

Demostramos la vulnerabilidad de los modelos de generación de datos tabulares a los ataques de inferencia de membresía y planteamos preguntas sobre la protección de la privacidad de los datos sintéticos.
MIA-EPT es un ataque de caja negra que demuestra que la información de membresía se puede inferir de manera efectiva sin acceder a la estructura interna del modelo.
La efectividad del ataque quedó demostrada al lograr rendimientos de hasta 0,599 en AUC-ROC y hasta 22,0% en TPR@10% y FPR@10%, respectivamente.
Demostró un potencial de ataque real al obtener el segundo lugar en la competencia MIDST 2025.
Hacer que la investigación sea más fácil de reproducir y utilizar haciendo público el código.
El rendimiento de MIA-EPT puede variar según el modelo y el conjunto de datos, y se necesita una evaluación más extensa.
Este estudio se centra en los métodos de ataque, y la exploración de los mecanismos de defensa sigue siendo un tema para futuras investigaciones.
👍