Dans cet article, nous proposons un système automatisé d'inspection qualité basé sur l'apprentissage automatique afin de remédier à l'inefficacité du contrôle qualité des images astronomiques actuel, basé sur l'humain. Nous développons un pipeline d'apprentissage semi-supervisé qui intègre le Vision Transformer (ViT), entraîné par apprentissage auto-supervisé (SSL), et le classificateur k-Nearest Neighbor (kNN) pour la région de faible extinction ($E(BV)<0,04$) du DECam Legacy Survey (DECaLS). Le pipeline est entraîné et validé à l'aide d'une petite quantité de données étiquetées issues des données d'observation de la Dark Energy Camera (DECam), et l'efficacité et la précision de la détermination de la qualité sont vérifiées par analyse de clustering. En l'appliquant aux nouvelles données d'image de DECaLS Data Release 11, 780 images problématiques sont identifiées et vérifiées par inspection visuelle. La méthodologie présentée dans cette étude est efficace et adaptable, offrant une solution évolutive applicable à la gestion de la qualité d'autres relevés d'images à grande échelle.