Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

SGDFuse : diffusion guidée par SAM pour la fusion d'images infrarouges et visibles haute fidélité

Created by
  • Haebom

Auteur

Xiaoyang Zhang, Jinjiang Li, Guodong Fan, Yakun Ju, Linwei Fan, Jun Liu, Alex C. Kot

Contour

Cet article propose SGDFuse, un modèle de diffusion conditionnelle utilisant le modèle Segment Anything (SAM), pour pallier les lacunes des méthodes existantes en matière de fusion d'images infrarouge-visible (IVIF), notamment le manque de compréhension sémantique approfondie, les artefacts et la perte de détails lors de la fusion. SGDFuse optimise le processus de fusion grâce à un modèle de diffusion conditionnelle, utilisant les masques sémantiques de haute qualité générés par le SAM comme informations préalables. Ce processus en deux étapes consiste d'abord à effectuer une fusion préliminaire des caractéristiques multimodales, puis à générer un modèle de débruitage, du grossier au fin, basé sur les masques sémantiques du SAM et de l'image fusionnée préliminaire. Cela garantit à la fois une directionnalité sémantique et des résultats haute fidélité. Les résultats expérimentaux démontrent que SGDFuse atteint des performances de pointe en termes d'évaluations subjectives et objectives, ainsi qu'une applicabilité aux tâches ultérieures. Le code source est disponible sur GitHub.

Takeaways, Limitations

Takeaways:
Nous présentons une nouvelle méthode permettant d'obtenir une fusion d'images infrarouges et visibles sémantiquement précise et de haute qualité à l'aide de SAM.
Contrôle détaillé du processus de fusion et résultats haute fidélité garantis grâce à un modèle de diffusion conditionnelle.
Performances de pointe vérifiées dans des évaluations subjectives et objectives et applicabilité aux travaux de suivi.
Assurer la reproductibilité et l'extensibilité grâce au code open source.
Limitations:
Cela peut dépendre des performances de SAM. Des erreurs de génération de masque dans SAM peuvent affecter les résultats de la fusion.
Les coûts de calcul peuvent être élevés. En raison de la nature du modèle de diffusion, les temps de traitement peuvent être longs.
La vérification des performances de généralisation est nécessaire pour divers environnements et ensembles de données.
👍