Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Une politique de diffusion axée sur les connaissances pour une conduite autonome de bout en bout basée sur un routage expert

Created by
  • Haebom

Auteur

Chengkai Xu, Jiaqi Liu, Yicheng Guo, Peng Hang, Jian Sun

Contour

Cet article propose une politique de diffusion basée sur les connaissances (KDP) pour relever les défis de la génération d'actions multimodales, de la stabilité temporelle et de la généralisation à travers divers scénarios de conduite autonome de bout en bout. KDP intègre une modélisation par diffusion générative et un mécanisme de routage mixte d'experts clairsemés pour générer des séquences d'actions multimodales temporellement cohérentes et activer des experts contextuels, spécialisés et réutilisables, permettant ainsi une construction modulaire des connaissances. Les résultats expérimentaux obtenus dans divers scénarios de conduite démontrent que KDP atteint des taux de réussite plus élevés, des risques de collision plus faibles et un contrôle plus fluide que les méthodes existantes. Des analyses plus approfondies confirment l'efficacité de l'activation d'experts clairsemés et du réseau de base Transformer, ainsi que la spécialisation structurelle et la réutilisation inter-scénarios des experts. Ces résultats démontrent que le modèle de diffusion avec routage d'experts est un paradigme évolutif et interprétable pour la conduite autonome de bout en bout.

Takeaways, Limitations

Takeaways:
Nous améliorons les performances de la conduite autonome de bout en bout en combinant un modèle de diffusion générative et un mécanisme de routage mixte expert clairsemé.
Nous avons amélioré la généralisation dans divers scénarios grâce à la cohérence temporelle, à la génération de comportements multimodaux et à l'organisation modulaire des connaissances.
Nous validons expérimentalement l’efficacité de l’activation experte clairsemée et de la dorsale Transformer.
Les structures de modèles interprétables permettent d'analyser les modèles de spécialisation et de réutilisation des experts.
Limitations:
Il existe un manque de validation de la méthode proposée dans les applications du monde réel.
Il existe une possibilité de surapprentissage pour certains scénarios.
Des recherches supplémentaires sont nécessaires pour déterminer le nombre et le type d’experts.
Les coûts de calcul peuvent être élevés.
👍