Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

TrajFlow : Prédiction de mouvement multimodale via la correspondance de flux

Created by
  • Haebom

Auteur

Qi Yan, Brian Zhang, Yutong Zhang, Daniel Yang, Joshua White, Di Chen, Jiachao Liu, Langechuan Liu, Binnan Zhuang, Shaoshuai Shi, Renjie Liao

Contour

TrajFlow est un nouveau framework de prédiction de mouvement basé sur la correspondance de flux. Il fournit une prédiction de mouvement efficace et précise pour une prise de décision sûre et éclairée en conduite autonome. Il résout les problèmes d'évolutivité et d'efficacité des méthodes de prédiction génératives existantes. Contrairement aux approches génératives actuelles qui nécessitent un échantillonnage iid et plusieurs passes d'inférence pour capturer divers résultats, il prédit plusieurs trajectoires futures possibles en une seule passe, réduisant ainsi considérablement la charge de calcul tout en maintenant la cohérence entre les prédictions. Nous proposons une perte de rang basée sur la distribution de Plackett-Luce pour améliorer l'estimation de l'incertitude des trajectoires prédites, et nous concevons une technique d'auto-conditionnement qui réutilise les prédictions du modèle pour construire des entrées bruitées lors du deuxième passage, améliorant ainsi les performances de généralisation et accélérant l'inférence. Grâce à des expériences approfondies sur le jeu de données de mouvement Waymo Open Motion Dataset (WOMD) à grande échelle, nous démontrons que TrajFlow atteint des performances de pointe sur divers indicateurs clés. Le code et d'autres détails sont disponibles sur le site web du projet ( https://traj-flow.github.io/) .

Takeaways, Limitations

Takeaways:
Il améliore considérablement l'efficacité du calcul en permettant la prédiction de chemin multimodal en un seul passage.
Nous avons amélioré l’estimation de l’incertitude des chemins prédits en utilisant la perte de classement basée sur la distribution de Plackett-Luce.
Amélioration des performances de généralisation et de la vitesse d'inférence grâce à des techniques d'entraînement par auto-conditionnement.
Il atteint des performances de pointe sur l'ensemble de données WOMD, démontrant une applicabilité pratique dans les domaines de la conduite autonome.
Limitations:
Bien que cela ne soit pas explicitement mentionné dans l'article, compte tenu des excellentes performances sur un ensemble de données spécifique (WOMD), les performances de généralisation sur d'autres ensembles de données ou environnements nécessitent une validation supplémentaire.
Une discussion plus détaillée et une analyse comparative du choix et des performances des fonctions de perte de classement utilisant la distribution de Plackett-Luce peuvent être nécessaires.
Une analyse plus approfondie de l’efficacité des techniques d’auto-conditionnement pourrait être nécessaire.
👍