Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

SGDFuse: Difusión guiada por SAM para fusión de imágenes infrarrojas y visibles de alta fidelidad

Created by
  • Haebom

Autor

Xiaoyang Zhang, Jinjiang Li, Guodong Fan, Yakun Ju, Linwei Fan, Jun Liu, Alex C. Kot

Describir

Este artículo propone SGDFuse, un modelo de difusión condicional que utiliza el Modelo Segment Anything (SAM), para abordar las deficiencias de los métodos existentes en la fusión de imágenes infrarrojas-visibles (IVIF), incluyendo la falta de una comprensión semántica profunda y la aparición de artefactos y pérdida de detalle durante el proceso de fusión. SGDFuse optimiza el proceso de fusión mediante un modelo de difusión condicional, utilizando las máscaras semánticas de alta calidad generadas por el SAM como información previa. El proceso, en dos pasos, implica primero la fusión preliminar de características multimodales y, posteriormente, la generación de un modelo de eliminación de ruido de grueso a fino basado en las máscaras semánticas del SAM y la imagen fusionada preliminar. Esto garantiza tanto la direccionalidad semántica como resultados de alta fidelidad. Los resultados experimentales demuestran que SGDFuse alcanza un rendimiento de vanguardia en términos de evaluaciones subjetivas y objetivas, así como su aplicabilidad a tareas posteriores. El código fuente está disponible en GitHub.

Takeaways, Limitations

Takeaways:
Presentamos un método novedoso para lograr una fusión de imágenes infrarrojas y de luz visible semánticamente precisa y de alta calidad utilizando SAM.
Control detallado del proceso de fusión y resultados de alta fidelidad garantizados utilizando un modelo de difusión condicional.
Desempeño de última generación verificado en evaluaciones subjetivas y objetivas y aplicabilidad al trabajo de seguimiento.
Garantizar la reproducibilidad y extensibilidad mediante código fuente abierto.
Limitations:
Puede depender del rendimiento de SAM. Errores en la generación de máscaras en SAM pueden afectar los resultados de la fusión.
Los costos computacionales pueden ser elevados. Debido a la naturaleza del modelo de difusión, los tiempos de procesamiento pueden ser largos.
Es necesaria la verificación del rendimiento de generalización para diversos entornos y conjuntos de datos.
👍