Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

MAGIC : Inpainting par diffusion guidée par masque avec perturbations multi-niveaux et alignement contextuel pour la génération d'anomalies en quelques prises

Created by
  • Haebom

Auteur

JaeHyuck Choi, MinJun Kim, JeHyeong Hong

Contour

Cet article aborde le problème de la génération d'anomalies en quelques clichés, une solution pratique pour enrichir les données d'anomalies rares dans le domaine du contrôle qualité industriel. Le générateur d'anomalies doit satisfaire simultanément à trois exigences : préserver le fond normal, superposer précisément l'anomalie avec un masque, générer des anomalies à des emplacements sémantiquement valides et générer des apparences réalistes et diversifiées. Les méthodes existantes basées sur la diffusion satisfont au plus deux de ces exigences : les générateurs d'anomalies globaux corrompent le fond, et les générateurs basés sur un masque échouent souvent lorsque le masque est imprécis ou mal placé. Dans cet article, nous proposons la méthode MAGIC (inpainting guidé par masque avec perturbations multi-niveaux et alignement contextuel) pour résoudre ces trois problèmes. MAGIC corrige directement la corruption du fond et les erreurs d'alignement en ajustant finement une structure stable de peinture par diffusion afin de préserver la région normale et de garantir que les anomalies synthétisées sont strictement conformes au masque fourni. Pour compenser la perte de diversité due au réglage fin, MAGIC ajoute deux stratégies de perturbation complémentaires : (i) une perturbation gaussienne au niveau de l'invite appliquée lors du réglage fin et de l'inférence élargit l'apparence globale des anomalies tout en évitant l'apparence de texte de mauvaise qualité ; et (ii) l'injection de bruit spatial par masque enrichit les variations textuelles locales. De plus, un module d'alignement de masques sensible au contexte établit des correspondances sémantiques et réaligne les masques afin de garantir que toutes les anomalies sont raisonnablement contenues dans les objets hôtes, supprimant ainsi les artefacts hors limites. Suivant un protocole d'évaluation identique et cohérent sur l'ensemble de données MVTec-AD, MAGIC surpasse les techniques de pointe existantes.

Takeaways, Limitations_

Takeaways:
Présentation d'une solution efficace au problème de la génération de plus d'un très petit nombre d'échantillons
Il répond aux trois exigences : préservation de l'arrière-plan, superposition précise du masque et génération de localisation sémantique.
Performances améliorées par rapport aux méthodes existantes vérifiées sur l'ensemble de données MVTec-AD
Générer des données anormales diverses et réalistes grâce à diverses stratégies de perturbation
Amélioration de la précision de localisation des anomalies grâce au module d'alignement de masque sensible au contexte
Limitations:
Seuls les résultats d'évaluation pour l'ensemble de données MVTec-AD sont présentés, une vérification supplémentaire des performances de généralisation est donc nécessaire.
Manque d’analyse du coût de calcul et de la complexité de la méthode proposée.
Une applicabilité supplémentaire et une évaluation des performances pour différents types de données anormales sont nécessaires.
Des recherches supplémentaires sont nécessaires sur l’applicabilité et l’efficacité dans des environnements industriels réels.
👍