[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Un paso más cerca: Creando el futuro para impulsar la finalización de escenas semánticas monoculares

Created by
  • Haebom

Autor

Haoang Lu, Yuanqi Su, Xiaoning Zhang, Hao Hu

Describir

Este artículo aborda el problema de la finalización semántica de escenas 3D visual (SSC), que infiere el diseño y la semántica de la escena 3D a partir de una única imagen 2D. Para superar las limitaciones de los métodos SSC monoculares existentes, que no pueden cubrir adecuadamente las situaciones de tráfico del mundo real donde una porción significativa de la escena está ocluida o fuera de la vista de la cámara, este artículo propone Creating the Future SSC (CF-SSC), un novedoso marco de SSC temporal que amplía el rango perceptual efectivo del modelo aprovechando la predicción de fotogramas pseudofuturos. CF-SSC establece correspondencias 3D precisas combinando pose y profundidad, y fusiona de forma geométricamente consistente fotogramas pasados, presentes y futuros previstos en el espacio 3D. A diferencia de los métodos existentes que se basan en el apilamiento simple de características, nuestra arquitectura de percepción 3D modela explícitamente las relaciones espaciotemporales para lograr una finalización de escena más robusta. Demostramos un rendimiento de última generación a través de experimentos exhaustivos en los puntos de referencia SemanticKITTI y SSCBench-KITTI-360, validando la eficacia de nuestro método en la inferencia de partes ocluidas y mejorando la precisión de finalización de escenas 3D.

Takeaways, Limitations

Takeaways:
Resolvemos eficazmente el problema de la parte ocluida, que es una limitación del SSC monocular, utilizando la predicción de cuadros pseudofuturos.
Presentamos una nueva arquitectura que fusiona geométricamente y consistentemente marcos pasados, presentes y futuros en un espacio 3D.
Logra un rendimiento de última generación en los puntos de referencia SemanticKITTI y SSCBench-KITTI-360.
Demostramos un rendimiento de finalización de escena más sólido al modelar explícitamente las relaciones espaciotemporales.
Limitations:
Falta análisis sobre el costo computacional y la viabilidad en tiempo real del método propuesto.
Se necesita una evaluación adicional de la robustez ante diversas condiciones climáticas o cambios en las fuentes de luz.
El rendimiento puede verse significativamente afectado por la precisión de las predicciones de fotogramas futuros. Se requiere una estrategia robusta para gestionar los errores de predicción.
👍