Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Amélioration de la localisation des objets satellites grâce aux convolutions dilatées et au regroupement spatial assisté par l'attention

Created by
  • Haebom

Auteur

Seraj Al Mahmud Mostafa, Chenxi Wang, Jia Yue, Yuta Hozumi, Jianwu Wang

Contour

Cet article aborde le fait que la localisation d'objets dans l'imagerie satellitaire est particulièrement difficile en raison de la diversité des objets, de la faible résolution spatiale, de l'interférence du bruit tel que les nuages ​​et les lumières urbaines, et de l'interférence des caractéristiques clés. Cette étude se concentre sur trois jeux de données satellitaires : les ondes de gravité de la haute atmosphère (GW), le mascaret mésosphérique et les tourbillons océaniques (OE), afin de répondre aux défis spécifiques de chaque jeu de données. Ces défis incluent la variabilité de l'échelle et de la forme des motifs d'objets clés, où la taille, la forme et la couverture des caractéristiques des objets d'intérêt peuvent varier considérablement. Pour relever ces défis, cet article présente YOLO-DCAP, une nouvelle version améliorée de YOLOv5 conçue pour améliorer la localisation d'objets dans des scénarios complexes. YOLO-DCAP intègre un bloc de convolution résiduelle dilatée multi-échelle (MDRC) qui capture des caractéristiques multi-échelles avec différents taux de dilatation, et un module de regroupement spatial assisté par l'attention (AaSP) qui améliore la sélection des caractéristiques en se concentrant sur les régions spatiales pertinentes à l'échelle mondiale. Ces améliorations structurelles contribuent à mieux localiser les objets dans l'imagerie satellitaire. Les résultats expérimentaux montrent que YOLO-DCAP surpasse significativement le modèle de base YOLO et les approches de pointe, avec une amélioration moyenne de 20,95 % du mAP50 et de 32,23 % de l'IoU par rapport au modèle de base, et de 7,35 % et 9,84 % par rapport aux alternatives de pointe. Les améliorations de performance constantes sur trois ensembles de données satellitaires soulignent la robustesse et la généralisabilité de l'approche proposée. Le code est disponible à l' adresse https://github.com/AI-4-atmosphere-remote-sensing/satellite-object-localization .

Takeaways, Limitations_

Takeaways:
Nous présentons un nouveau modèle YOLO-DCAP qui améliore les performances de localisation d'objets dans les images satellites.
Des performances toujours excellentes sur une variété d’ensembles de données satellitaires.
Vérification expérimentale de l'efficacité des blocs MDRC et des modules AaSP.
Améliorer l’accessibilité grâce à la divulgation du code source ouvert.
Limitations:
Limité à l'évaluation des performances sur un ensemble de données satellitaires spécifique. Une vérification plus approfondie de la généralisabilité à d'autres types de données d'images satellitaires est nécessaire.
Une analyse plus approfondie est nécessaire sur la complexité de calcul du modèle et son potentiel de traitement en temps réel.
Des recherches supplémentaires sont nécessaires sur la robustesse du modèle à divers bruits et interférences.
👍