[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

DINO-VO: una odometría visual basada en características que aprovecha un modelo de Visual Foundation

Created by
  • Haebom

Autor

Maulana Bisyir Azhari, David Hyunchul Shim

Describir

En este artículo, presentamos DINO-VO, un sistema robusto y generalizado de odometría visual (VO) monocular que aprovecha las ventajas de modelos visuales como DINOv2. Para abordar la baja resolución de características de DINOv2, proponemos un detector de puntos clave adaptado a DINOv2 y añadimos características geométricas para una localización más precisa. Realizamos una estimación precisa del movimiento de la cámara mediante correspondencia basada en transformadores y una capa de estimación de pose diferenciable, superando así los métodos existentes en los conjuntos de datos TartanAir, KITTI y EuRoC. Logramos una alta eficiencia con una velocidad de 72 FPS y una memoria inferior a 1 GB, y mostramos un rendimiento competitivo con sistemas Visual SLAM, incluso en situaciones de conducción al aire libre.

Takeaways, Limitations

Takeaways:
Mejora de la robustez y el rendimiento de generalización de la VO monocular aprovechando modelos basados en lo visual como DINOv2.
Presentamos un nuevo detector de puntos clave y una estrategia de combinación de características para complementar las características básicas de DINOv2.
Estimación precisa del movimiento de la cámara mediante correspondencia basada en transformador y estimación de pose diferenciable.
Logra un rendimiento y una eficiencia superiores a los métodos existentes en los conjuntos de datos TartanAir, KITTI y EuRoC.
Rendimiento competitivo con sistemas Visual SLAM en escenarios de conducción al aire libre.
Limitations:
Limitado a la evaluación del desempeño en un conjunto de datos específico, el desempeño de generalización en otros tipos de conjuntos de datos requiere validación adicional.
Falta de análisis de los problemas y la estabilidad que pueden surgir al aplicarlo a sistemas robóticos reales.
Falta de presentación clara del método propuesto __T46682_____ y futuras direcciones de investigación.
👍