Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Hacia un etiquetado de píxeles eficiente para la detección y localización de anomalías industriales

Created by
  • Haebom

Autor

Jingqi Wu, Hanxi Li, Lin Yuanbo Wu, Hao Chen, Deyin Liu, Peng Wang

Describir

Este artículo propone ADClick, un algoritmo de segmentación interactiva de imágenes (IIS) para la inspección de productos industriales. ADClick mejora significativamente el rendimiento de los modelos de detección de anomalías al generar anotaciones de detección de anomalías a nivel de píxel con tan solo unos clics del usuario y breves descripciones de texto, sin anotaciones a nivel de píxel de muestras defectuosas (p. ej., AP = 96,1 % en MVTec AD). Además, presentamos ADClick-Seg, un marco multimodal que alinea las características visuales y las indicaciones de texto mediante un enfoque basado en prototipos. Al combinar la información previa a nivel de píxel con guías lingüísticas, ADClick-Seg logra resultados de vanguardia en la exigente tarea de detección de anomalías multiclase (AP = 80,0 %, PRO = 97,5 %, AUROC de píxel = 99,1 % en MVTec AD).

Takeaways, Limitations

Takeaways:
Genere anotaciones de detección de anomalías eficientes y precisas sin anotaciones a nivel de píxel.
Detección precisa de anomalías posible con solo clics del usuario y descripciones de texto.
Aproveche eficazmente las características visuales y las indicaciones de texto a través de un marco multimodal.
Lograr un rendimiento de vanguardia en el conjunto de datos MVTec AD
Limitations:
Se necesitan experimentos adicionales para evaluar el rendimiento de generalización del método propuesto.
Necesidad de evaluar la aplicabilidad a diversos entornos industriales y tipos de productos.
Es necesario analizar los cambios de rendimiento según la cantidad de clics del usuario o la calidad de las descripciones de texto.
👍