Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Mejora de la correspondencia estéreo omnidireccional con un modelo de base de profundidad entrenado previamente

Created by
  • Haebom

Autor

Jannik Endres, Oliver Hahn, Charles Corbière , Simone Schaub-Meyer, Stefan Roth, Alexandre Alahi

Describir

Este artículo propone DFI-OmniStereo, un novedoso método para la percepción de profundidad omnidireccional. Su objetivo es generar mapas de profundidad de alta resolución mediante la estimación de profundidad estéreo de bajo coste basada en cámaras omnidireccionales. Para superar las limitaciones de los métodos existentes, utilizamos un modelo base preentrenado a gran escala para realizar la estimación de la profundidad monocular relativa dentro de una arquitectura de coincidencia estéreo basada en optimización iterativa. Específicamente, utilizamos características de profundidad monocular relativa mediante una estrategia de entrenamiento en dos pasos para realizar un ajuste fino invariante a la escala. En el conjunto de datos reales Helvipad, logramos resultados de vanguardia, reduciendo la MAE de disparidad en aproximadamente un 16 % en comparación con el método estéreo omnidireccional de mejor rendimiento.

Takeaways, Limitations

Takeaways:
Mejoramos la precisión de la correspondencia estéreo omnidireccional aprovechando un modelo base entrenado previamente a gran escala.
Una novedosa estrategia de entrenamiento de dos pasos utiliza eficazmente la información de profundidad monocular relativa.
Logramos resultados que superaron el desempeño de última generación anterior en el conjunto de datos Helvipad.
Esto podría traer avances significativos a la robótica móvil, que requiere percepción de profundidad omnidireccional.
Limitations:
Se necesita más evaluación para determinar qué tan bien se generaliza el método propuesto a un conjunto de datos específico (Helvipad).
Es necesario mejorar aún más la robustez ante diferentes entornos, rangos de profundidad y condiciones de iluminación.
Falta análisis sobre los costos computacionales y el potencial de procesamiento en tiempo real.
👍