Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

LSD-3D : Génération de scènes de conduite 3D à grande échelle avec mise à la terre géométrique

Created by
  • Haebom

Auteur

Julian Ost, Andrea Ramazzina, Amogh Joshi, Maximilian Bömer , Mario Bijelic, Felix Heide

Contour

Cet article aborde le problème de la génération de données de scènes à grande échelle pour l'apprentissage robotique. Les méthodes de reconstruction existantes basées sur les réseaux neuronaux sont utiles pour reconstruire des scènes extérieures à grande échelle à partir d'environnements réels, mais elles sont limitées aux environnements statiques et manquent de diversité de scènes et de trajectoires. À l'inverse, les modèles récents de diffusion d'images ou de vidéos offrent une certaine contrôlabilité, mais manquent de fondements géométriques et de causalité. Pour surmonter ces limitations, cette étude présente une méthode permettant de générer directement des scènes de conduite 3D à grande échelle avec des informations géométriques précises. La méthode proposée combine la génération de géométrie proxy et de représentation de l'environnement avec la distillation de scores à partir d'images 2D a priori apprises, offrant une grande contrôlabilité et permettant la génération de scènes de conduite 3D complexes, réalistes et géométriquement cohérentes, conditionnées par la disposition de la carte.

Takeaways, Limitations

Takeaways:
Une nouvelle méthode permettant de générer directement des scènes de conduite 3D à grande échelle avec des informations géométriques précises est présentée.
Offre un contrôle élevé, permettant une géométrie basée sur des invites et une création de texture et de structure haute fidélité.
Création 3D réaliste et géométriquement cohérente possible sur la base de la disposition de la carte
Synthèse de nouvelles vues causales possible grâce à la persistance des objets et à l'estimation explicite de la géométrie 3D.
Limitations:
Manque de détails spécifiques sur l’évaluation des performances de la méthode proposée.
La validation des performances de généralisation sur des ensembles de données à grande échelle est nécessaire.
Des recherches supplémentaires sont nécessaires sur l’applicabilité aux systèmes robotiques réels.
👍