Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Revisando la detección fuera de distribución en la detección de objetos en tiempo real: de los problemas de referencia a un nuevo paradigma de mitigación

Created by
  • Haebom

Autor

Changshun Wu, Weicheng He, Chih-Hong Cheng, Xiaowei Huang, Saddek Bensalem

Describir

Este artículo argumenta que abordar el problema del exceso de confianza de los modelos de detección de objetos basados ​​en aprendizaje profundo en entradas Fuera de Distribución (OoD) requiere un replanteamiento integral del ciclo de vida del desarrollo, más allá de mejoras algorítmicas como la mejora de la función de puntuación existente y el ajuste de los umbrales de tiempo de prueba. Destacamos los errores (hasta un 13% de contaminación) de los puntos de referencia de evaluación de detección de OoD existentes y proponemos un nuevo paradigma de mitigación en tiempo de entrenamiento que ajusta el detector utilizando un conjunto de datos de OoD semánticamente similar, en lugar de depender de detectores de OoD externos. Este enfoque reduce los errores de alucinación en un 91% en el entorno BDD-100K para el modelo YOLO y demuestra la generalización a varios métodos de detección, incluyendo YOLO, Faster R-CNN y RT-DETR, así como a la adaptación a disparos pequeños.

Takeaways, Limitations

Takeaways:
Al revelar graves problemas de contaminación de datos en los puntos de referencia de evaluación de detección de OoD existentes, planteamos preguntas sobre la confiabilidad de los resultados de investigación existentes y enfatizamos la necesidad de criterios de evaluación más rigurosos.
Presentamos un enfoque novedoso para mejorar la resistencia OoD del propio modelo aprovechando los datos OoD durante el tiempo de entrenamiento.
Se presenta una metodología general que se puede aplicar a varios modelos de detección de objetos como YOLO, Faster R-CNN y RT-DETR, y se puede adaptar incluso con pequeñas cantidades de datos.
Demostramos mejoras sustanciales en el rendimiento, reduciendo el error de alucinación del modelo YOLO en un 91% en el conjunto de datos BDD-100K.
Limitations:
La eficacia del método propuesto podría limitarse a conjuntos de datos y modelos específicos. Se requieren experimentos adicionales con diversos conjuntos de datos y modelos.
Se necesita más análisis sobre el costo computacional y la complejidad de preparación de datos del nuevo paradigma de relajación del tiempo de entrenamiento.
La tasa de contaminación del 13% corresponde a un parámetro de referencia específico, y se necesita mayor verificación para determinar si se aplica igualmente a otros parámetros de referencia.
👍