Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

SGDFuse : diffusion guidée par SAM pour la fusion d'images infrarouges et visibles haute fidélité

Created by
  • Haebom

Auteur

Xiaoyang Zhang, Zhen Hua, Yakun Ju, Wei Zhou, Jun Liu, Alex C. Kot

Contour

Cet article propose SGDFuse, un modèle de diffusion conditionnelle utilisant le modèle Segment Anything (SAM), pour pallier les lacunes des méthodes existantes en matière de fusion d'images infrarouge-visible (IVIF), notamment le manque de compréhension sémantique approfondie, la génération d'artefacts et la perte de détails. SGDFuse optimise le processus de fusion grâce à un modèle de diffusion conditionnelle, exploitant les masques sémantiques de haute qualité générés par le SAM comme informations préalables explicites. Ce processus en deux étapes consiste d'abord à effectuer une fusion préliminaire des caractéristiques multimodales, puis à débruiter le modèle de diffusion de grossier à fin, conditionné par les masques sémantiques du SAM et de l'image fusionnée préliminaire. Cela garantit la directionnalité sémantique et une haute fidélité du résultat final. Les résultats expérimentaux démontrent que SGDFuse atteint des performances de pointe en termes d'évaluations subjectives et objectives, ainsi qu'une applicabilité aux tâches en aval. Le code source est disponible sur GitHub.

Takeaways, Limitations

Takeaways:
Nous démontrons que SAM peut être utilisé pour obtenir des résultats de fusion d’images infrarouges et visibles sémantiquement riches et de haute qualité.
Résout efficacement les problèmes de génération d’artefacts et de perte d’informations détaillées dans les méthodes existantes.
Excellente applicabilité aux tâches en aval, potentiel élevé d'applications pratiques.
Atteindre des performances de pointe.
Assurer la reproductibilité et l'extensibilité grâce au code open source.
Limitations:
Cela peut dépendre des performances de SAM. La dégradation des performances de SAM peut avoir un impact sur les performances de SGDFuse.
Peut être coûteux en calcul. Étant basé sur un modèle de diffusion, le temps de traitement peut être long.
SAM peut avoir de mauvaises performances sur certains types d'images, il existe donc une possibilité de mauvaises performances de fusion sur ces images.
👍