Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

SEAL : Conduite autonome coopérative sécurisée de bout en bout basée sur un modèle vision-langage avec modélisation adaptative à longue traîne

Created by
  • Haebom

Auteur

Junwei You, Pei Li, Zhuoyu Jiang, Zilin Huang, Rui Gan, Haotian Shi, Bin Ran

Contour

Dans cet article, nous proposons SEAL, un framework basé sur un modèle de langage visuel avec apprentissage multimodal adaptatif pour la conduite autonome coopérative. Ce framework vise à relever les défis de sécurité majeurs rencontrés par les technologies de conduite autonome dans des conditions météorologiques rares, variées et visuellement difficiles. SEAL introduit trois innovations clés : un pipeline de génération et d'évaluation de scénarios à longue traîne basé sur des invites qui enrichit efficacement la diversité de la formation en synthétisant des situations réalistes à longue traîne telles que la neige et le brouillard du point de vue du véhicule et de l'infrastructure ; un module d'attention adaptative multi-scénarios à portes qui utilise un dictionnaire de scénarios pour ajuster le flux visuel afin de recalibrer les caractéristiques ambiguës ou corrompues ; et un objectif d'apprentissage contrastif multi-tâches prenant en compte les scénarios qui améliore l'alignement multimodal et la séparabilité des caractéristiques entre les scénarios. Grâce à des expériences approfondies, nous démontrons que SEAL surpasse significativement les références existantes en termes d'inférence, de sécurité et de précision de planification dans des conditions de conduite complexes et difficiles, améliorant ainsi la sécurité, la robustesse et l'évolutivité de la conduite autonome.

Takeaways, Limitations

Takeaways:
Nous présentons un nouveau cadre permettant de générer et d’évaluer efficacement des scénarios à longue traîne afin d’améliorer la sécurité de la conduite autonome.
Nous améliorons les performances dans divers scénarios grâce à des modules d'attention adaptative multi-scénarios fermés et à des objectifs d'apprentissage contrastifs multi-tâches tenant compte des scénarios.
Il démontre des performances supérieures aux normes existantes dans des conditions de conduite complexes, augmentant ainsi la praticité de la technologie de conduite autonome.
Limitations:
Une évaluation plus approfondie des performances de généralisation de la méthode proposée est nécessaire.
Il y a un manque de vérification de l’applicabilité pratique car les résultats des tests dans des environnements réels ne sont pas présentés.
Les limites des modèles sous-jacents utilisés pour générer des scénarios à longue traîne peuvent avoir un impact sur les performances de SEAL.
👍