Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Límite sobre la mesa: Ataques eficientes basados ​​en decisiones de caja negra para datos estructurados

Created by
  • Haebom

Autor

Roie Kazoom, Yuval Ratzabi, Etamar Rothstein, Ofer Hadar

Describir

Este artículo aborda la robustez adversarial en datos estructurados, un campo poco explorado en comparación con los dominios visual y lingüístico. Para ello, proponemos un novedoso ataque adversarial de caja negra basado en decisiones para datos intervenidos. Este ataque explora eficientemente espacios de características discretos y continuos con un acceso mínimo a oráculos, combinando la estimación de dirección sin gradiente y la búsqueda iterativa de límites. Experimentos exhaustivos demuestran que el método propuesto compromete con éxito prácticamente todo el conjunto de pruebas en diversos modelos, desde clasificadores clásicos de aprendizaje automático hasta pipelines basados ​​en modelos de lenguaje (LLM) a gran escala. Cabe destacar que el ataque alcanza consistentemente una tasa de éxito superior al 90 % con un número reducido de consultas por instancia. Estos resultados resaltan la grave vulnerabilidad de los modelos intervenidos a las perturbaciones adversariales y subrayan la urgente necesidad de defensas más robustas en los sistemas de toma de decisiones del mundo real.

Takeaways, Limitations

Takeaways:
Demostramos que el modelo de datos tabulares es vulnerable a ataques adversarios.
El método de ataque de caja negra propuesto logra altas tasas de éxito en varios modelos.
Esto plantea la necesidad de defensas adicionales para garantizar la solidez del actual sistema de toma de decisiones.
Limitations:
El ataque específico Limitations presentado en este artículo no se menciona explícitamente.
No se incluye ninguna discusión sobre métodos defensivos.
👍