[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

SEMT : Architecture de réseau de transformateurs à expansion statique pour le sous-titrage d'images de télédétection

Created by
  • Haebom

Auteur

Khang Truong, Lam Pham, Hieu Tang, Jasmin Lampert, Martin Boyer, Son Phan, Truong Nguyen

Contour

Dans cet article, nous présentons une architecture réseau basée sur des transformateurs pour le sous-titrage d'images de télédétection (RSIC). Nous évaluons et intégrons plusieurs techniques, dont l'expansion statique, l'auto-attention augmentée en mémoire et le transformateur de maillage, et évaluons le modèle à l'aide de deux jeux de données d'images de télédétection, UCM-Caption et NWPU-Caption. Le modèle le plus performant proposé surpasse les systèmes de pointe dans la plupart des paramètres d'évaluation, démontrant ainsi son potentiel d'application aux systèmes d'images de télédétection réels.

Takeaways, Limitations

Takeaways:
Une architecture efficace basée sur un transformateur pour la génération de légendes d'images de télédétection est présentée.
Amélioration des performances grâce à l'intégration de diverses techniques.
Démonstration de l’applicabilité des systèmes de télédétection du monde réel.
Atteindre des performances de pointe.
Limitations:
Limitations sur le type et la taille de l'ensemble de données utilisé.
Manque d’analyse approfondie de l’efficacité de techniques spécifiques.
Une validation supplémentaire est nécessaire pour les applications système du monde réel.
👍