[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Ataques generativos conscientes de la estructura semántica para una mejor transferibilidad adversarial

Created by
  • Haebom

Autor

Jongoh Jeong, Hunmin Yang, Jaeseok Jeong, Kuk-Jin Yoon

Describir

Este artículo trata sobre ataques generativos adversarios que entrenan un generador de perturbaciones en un modelo sustituto de caja blanca para su aplicación a un modelo de Big Team de caja trasera. A diferencia de los ataques iterativos convencionales, los ataques generativos adversarios tienen excelente eficiencia en el tiempo de inferencia, escalabilidad y transferibilidad, pero estudios previos no han logrado aprovechar al máximo las capacidades de expresión de los modelos generativos para preservar y utilizar la información semántica. En este artículo, señalamos que, si bien las activaciones intermedias del generador contienen características semánticas ricas, como límites de objetos y formas aproximadas, no se utilizan en su totalidad, lo que limita la alineación de las perturbaciones con las regiones relacionadas con los objetos. Para abordar este problema, este artículo propone un marco de ataque consciente de la estructura semántica basado en Mean Teacher. Mean Teacher actúa como una referencia de características suavizada temporalmente, lo que mejora la consistencia semántica entre las activaciones de la capa inicial del modelo del estudiante y las activaciones semánticamente ricas del modelo del Profesor mediante la destilación de características. Con base en resultados experimentales, anclamos la generación de perturbaciones a los bloques intermedios tempranos semánticamente importantes del generador, induciendo así perturbaciones adversarias progresivas en regiones que mejoran significativamente la transferibilidad adversaria. Mediante experimentos exhaustivos en diversos modelos, dominios y tareas, demostramos mejoras consistentes en el rendimiento con respecto a los ataques generativos de vanguardia existentes y las evaluamos exhaustivamente utilizando las métricas existentes y la recién propuesta Tasa de Corrección Accidental (ACR).

Takeaways, Limitations

Takeaways:
Un nuevo marco para mejorar la transferibilidad de ataques generativos adversarios
Alineación mejorada de la perturbación con las regiones relacionadas con los objetos aprovechando la información semántica
Verificación de la eficacia de un marco de ataque consciente de la estructura semántica basado en Mean Teacher
Presentamos una nueva métrica de evaluación, ACR
Presentación de amplios resultados experimentales para una variedad de modelos, dominios y tareas.
Limitations:
Aumento potencial del coste computacional debido al uso de Mean Teacher
Se necesita más investigación sobre la aplicabilidad general del índice ACR
Posible dependencia de un modelo de producción específico
Se necesita una mayor verificación de la generalización debido a las limitaciones del entorno experimental.
👍