Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

OC-SOP : Amélioration de la prédiction d'occupation sémantique 3D basée sur la vision par la connaissance centrée sur l'objet

Created by
  • Haebom

Auteur

Helin Cao, Sven Behnke

Contour

Cet article présente la tâche de prédiction sémantique d'occupation (SOP), qui déduit simultanément la géométrie de la scène et les étiquettes sémantiques à partir d'images afin de relever les défis de l'occlusion d'objets et des données de scène incomplètes dans les systèmes de perception de conduite autonome. Pour pallier les lacunes des méthodes existantes basées sur les caméras, qui traitent toutes les catégories de manière égale et s'appuient principalement sur des caractéristiques locales, ce qui entraîne de faibles performances de prédiction, en particulier pour les objets dynamiques de premier plan, nous proposons un cadre SOP centré sur l'objet (OC-SOP). OC-SOP améliore significativement la précision de la prédiction des objets de premier plan en intégrant des indices de haut niveau centrés sur l'objet, extraits via des branches de détection, dans le pipeline de prédiction sémantique d'occupation, atteignant ainsi des performances de pointe pour toutes les catégories de l'ensemble de données SemanticKITTI.

Takeaways, Limitations

Takeaways:
Nous avons amélioré la précision de la prédiction d'occupation sémantique, en particulier la prédiction dynamique des objets de premier plan, en incorporant des indices centrés sur l'objet.
A atteint des performances de pointe sur l'ensemble de données SemanticKITTI.
Il peut contribuer à améliorer les performances des systèmes de perception de conduite autonome.
Limitations:
Les performances de la méthode proposée peuvent être limitées à un ensemble de données spécifique (SemanticKITTI).
Une validation supplémentaire des performances de généralisation dans des environnements réels est nécessaire.
ÉTant donné que cela peut dépendre des performances de la branche de détection, une erreur dans la branche de détection peut affecter les performances globales du système.
👍