Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

SWA-SOP : Attention à la fenêtre spatialement consciente pour la prédiction sémantique de l'occupation dans la conduite autonome

Created by
  • Haebom

Auteur

Helin Cao, Rafael Materla, Sven Behnke

Contour

Cet article se concentre sur la prédiction sémantique d'occupation (SOP), qui déduit des informations d'occupation et sémantiques dans des zones non observées afin de pallier l'incomplétude des données des capteurs (LiDAR et caméra) en conduite autonome. Pour pallier le manque de modélisation de la structure spatiale dans les méthodes SOP existantes basées sur Transformer, nous proposons l'attention fenêtrée spatialement consciente (SWA), un nouveau mécanisme qui intègre le contexte spatial local à l'attention. SWA atteint des performances de pointe sur les benchmarks SOP basés sur LiDAR et démontre également son applicabilité aux SOP basés sur caméra.

Takeaways, Limitations_

Takeaways:
Nous soulignons l’importance d’utiliser les informations spatiales dans les SOP basés sur LiDAR et caméra et démontrons l’amélioration des performances grâce à SWA.
Nous démontrons que SWA est un mécanisme général applicable à diverses modalités.
Cela peut contribuer à améliorer la sécurité et la fiabilité des systèmes de conduite autonome.
Limitations:
Les améliorations des performances de SWA sont probablement limitées à des ensembles de données de référence spécifiques.
Une validation supplémentaire des performances de généralisation dans des environnements de conduite autonome réels est nécessaire.
La grande complexité de calcul de SWA peut limiter le traitement en temps réel.
👍