Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Monitoreo de confiabilidad no invasivo basado en entropía de redes neuronales convolucionales

Created by
  • Haebom

Autor

Amirhossein Nazeri, Wael Hafez

Describir

Este artículo presenta un método novedoso para monitorear la entropía de las activaciones de redes neuronales convolucionales (CNN) con el fin de abordar su vulnerabilidad a ataques adversarios. A diferencia de los métodos existentes de detección de ataques adversarios que requieren reentrenamiento del modelo, modificación de la arquitectura de red o degradación del rendimiento con entradas normales, nuestro método detecta entradas adversarias detectando cambios en la entropía de activación sin modificar el modelo. Los resultados experimentales con VGG-16 muestran que las entradas adversarias cambian consistentemente la entropía de activación en aproximadamente un 7% en las primeras capas convolucionales, logrando una precisión de detección del 90% y manteniendo las tasas de falsos positivos y falsos negativos por debajo del 20%. Este resultado demuestra que las CNN codifican inherentemente cambios distribucionales en sus patrones de activación, lo que sugiere que la entropía de activación por sí sola puede utilizarse para evaluar la confiabilidad de las CNN. Por lo tanto, este estudio permite el despliegue práctico de sistemas de visión de autodiagnóstico que detectan entradas adversarias en tiempo real sin degradación del modelo.

Takeaways, Limitations

Takeaways:
Permite la detección de ataques adversarios en CNN sin modificar el modelo.
Presentar la viabilidad de implementar un sistema de visión de autodiagnóstico para la detección de entradas adversarias en tiempo real.
Se presenta un método de evaluación de confiabilidad de CNN utilizando entropía de activación.
Logra una alta precisión de detección (90%) y una baja tasa de error (menos del 20%).
Limitations:
Sólo se presentan resultados experimentales para el modelo VGG-16, por lo que se necesita más investigación para determinar la generalización a otras arquitecturas de CNN.
Se necesita una evaluación adicional del rendimiento de detección contra varios tipos de ataques adversarios.
Se necesita una mayor validación del rendimiento y la robustez en entornos del mundo real.
👍