Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

InfiniCube : Génération de scènes de conduite 3D dynamiques, illimitées et contrôlables, avec des modèles vidéo guidés par le monde

Created by
  • Haebom

Auteur

Yifan Lu, Xuanchi Ren, Jiawei Yang, Tianchang Shen, Zhangjie Wu, Jun Gao, Yue Wang, Siheng Chen, Mike Chen, Sanja Fidler, Jiahui Huang

Contour

InfiniCube est une méthode évolutive permettant de générer des scènes de conduite 3D dynamiques infinies, hautement fidèles et contrôlables. Les méthodes de génération de scènes existantes sont limitées en termes d'échelle ou manquent de cohérence géométrique et d'apparence entre les séquences générées. InfiniCube s'appuie sur les avancées récentes en matière de représentations 3D évolutives et de modèles vidéo pour générer des scènes dynamiques à grande échelle, flexibles et contrôlables, avec des cartes HD, des cadres de délimitation de véhicules et des descriptions textuelles. Nous construisons d'abord un modèle génératif 3D conditionnel basé sur des voxels clairsemés, afin d'exploiter la capacité de génération d'univers voxels infinis. Ensuite, nous réutilisons le modèle vidéo et synthétisons une apparence cohérente basée sur l'univers voxel grâce à une série de tampons de guidage soigneusement conçus et alignés sur les pixels. Enfin, nous proposons une approche accélérée utilisant à la fois les branches voxels et pixels pour transformer la vidéo dynamique en gaussiennes 3D dynamiques avec des objets contrôlables. Cette méthode permet de générer des scènes de conduite 3D contrôlables et réalistes, et nous vérifions l’efficacité et la supériorité du modèle grâce à des expériences approfondies.

Takeaways, Limitations_

Takeaways: Capable de générer des scènes de conduite 3D dynamiques infinies avec une haute fidélité et une grande contrôlabilité, un contrôle flexible via des cartes HD, des boîtes de délimitation de véhicule et des descriptions textuelles, résolvant les limitations d'échelle et les problèmes d'incohérence des méthodes traditionnelles.
Limitations: L'article ne mentionne pas explicitement Limitations. Des expériences et analyses supplémentaires sont nécessaires pour évaluer le coût de calcul, la diversité des scènes générées et les limites du réalisme.
👍