Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

IAD-R1 : Renforcer la cohérence du raisonnement dans la détection des anomalies industrielles

Created by
  • Haebom

Auteur

Yanhui Li, Yunkang Cao, Chengliang Liu, Yuan Xiong, Xinghui Dong, Chao Huang

Contour

Cet article propose IAD-R1, un nouveau cadre de post-apprentissage qui exploite le modèle vision-langage (VLM) pour résoudre le problème de la détection d'anomalies en milieu industriel. Pour pallier le manque de données sur les défauts, nous utilisons une stratégie d'apprentissage en deux étapes. La première étape, le réglage fin supervisé par activation de la perception (PA-SFT), utilise le jeu de données de haute qualité Expert-AD (Chain-of-Thought Data Set) pour améliorer la détection d'anomalies et établir des corrélations inférence-réponse. La deuxième étape, l'optimisation des politiques relatives des groupes de contrôle structurés (SC-GRPO), améliore encore la détection d'anomalies grâce à une fonction de récompense. Les résultats expérimentaux démontrent qu'IAD-R1 améliore les performances sur sept VLM, en particulier sur le jeu de données DAGM, avec une amélioration moyenne de la précision de 43,3 % par rapport au modèle de base. De plus, un modèle de 0,5 milliard de paramètres entraîné avec IAD-R1 surpasse les modèles commerciaux tels que GPT-4.1 et Claude-Sonnet-4 en configuration zéro-coup. Le code, l’ensemble de données et les pondérations du modèle sont accessibles au public.

Takeaways, Limitations

Takeaways:
Nous présentons un nouveau cadre de post-formation, IAD-R1, qui améliore considérablement les performances de détection d'anomalies industrielles basées sur VLM.
Polyvalence applicable à diverses architectures VLM et tailles de paramètres
Atteindre des performances supérieures à celles des modèles commerciaux dans des conditions de tir zéro
Démontrer l'efficacité d'Expert-AD, un ensemble de données de chaîne de pensée de haute qualité
Augmentez la reproductibilité et l’évolutivité de la recherche en rendant publics le code, les ensembles de données et les pondérations des modèles.
Limitations:
Il est possible que l’amélioration des performances de l’IAD-R1 soit biaisée en faveur d’un ensemble de données spécifique (DAGM).
Il est nécessaire de vérifier les performances de généralisation pour d'autres secteurs ou types d'anomalies
Manque possible de description détaillée du processus de création et de la qualité de l'ensemble de données Expert-AD
Des explications supplémentaires sont nécessaires concernant la conception de la fonction de récompense du SC-GRPO.
👍