Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Un método simple y eficaz para la cuantificación de la incertidumbre y la detección de OOD

Created by
  • Haebom

Autor

Yaxin Ma, Benjamín Colburn, José C. Príncipe

Describir

Este artículo propone un novedoso método de cuantificación de la incertidumbre basado en un único modelo determinista para abordar el alto coste computacional y los requisitos de almacenamiento de las redes neuronales bayesianas y los métodos de conjuntos profundos. Específicamente, aproximamos la densidad del espacio de características de un conjunto de entrenamiento utilizando el campo de potencial de información derivado de la estimación de la densidad kernel. Posteriormente, comparamos este campo de potencial de información con la representación del espacio de características de las muestras de prueba para detectar eficazmente los cambios distribucionales y realizar la detección de fuera de distribución (OOD). Los resultados experimentales utilizando conjuntos de datos sintéticos bidimensionales (Dos Lunas, Tres Espirales) y tareas de detección OOD (CIFAR-10 vs. SVHN) demuestran que el método propuesto supera a los métodos existentes.

Takeaways, Limitations

Takeaways: Permitir la cuantificación efectiva de la incertidumbre y la detección de OOD, a la vez que se reduce el coste computacional y el espacio de almacenamiento mediante un único modelo determinista. Demostrando la utilidad de un enfoque basado en la densidad del espacio de características.
Limitations: El rendimiento del método propuesto se basa en resultados experimentales con conjuntos de datos sintéticos y conjuntos de datos reales limitados (CIFAR-10, SVHN). Por lo tanto, se requieren experimentos adicionales con conjuntos de datos más diversos y complejos. Se carece de análisis de sensibilidad sobre la configuración de los parámetros de la estimación de la densidad kernel. Se requiere mayor investigación para determinar su escalabilidad a datos de alta dimensión.
👍