Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

LSD-3D: Generación de escenas de conducción 3D a gran escala con base geométrica

Created by
  • Haebom

Autor

Julian Ost, Andrea Ramazzina, Amogh Joshi, Maximilian Bömer , Mario Bijelic, Felix Heide

Describir

Este artículo aborda el problema de la generación de datos de escenas a gran escala para el aprendizaje robótico. Los métodos de reconstrucción existentes basados ​​en redes neuronales son útiles para reconstruir escenas exteriores a gran escala basadas en entornos reales, pero se limitan a entornos estáticos y carecen de diversidad de escenas y trayectorias. Por el contrario, los modelos recientes de difusión de imágenes o vídeos ofrecen controlabilidad, pero carecen de fundamentos geométricos y causalidad. Para superar estas limitaciones, este estudio presenta un método para generar directamente escenas de conducción 3D a gran escala con información geométrica precisa. El método propuesto combina la geometría proxy y la generación de representaciones del entorno con la destilación de puntuaciones a partir de imágenes 2D previas aprendidas, lo que proporciona una alta controlabilidad y permite la generación de escenas de conducción 3D complejas, realistas y geométricamente consistentes, condicionadas al diseño del mapa.

Takeaways, Limitations

Takeaways:
Se presenta un nuevo método para generar directamente escenas de conducción en 3D a gran escala con información geométrica precisa.
Proporciona un alto control, lo que permite la creación de geometría basada en indicaciones y texturas y estructuras de alta fidelidad.
Es posible la creación de 3D realista y geométricamente consistente según el diseño del mapa.
La síntesis de una nueva vista causal es posible mediante la persistencia de objetos y la estimación explícita de la geometría 3D.
Limitations:
Falta de detalles específicos sobre la evaluación del desempeño del método propuesto.
Es necesaria la validación del rendimiento de generalización en conjuntos de datos a gran escala.
Se necesita más investigación sobre su aplicabilidad a sistemas robóticos reales.
👍