Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

LiDAR-BIND-T: Traducción y fusión de modalidades de sensores mejorada y temporalmente consistente para aplicaciones robóticas

Created by
  • Haebom

Autor

Niels Balemans, Ali Anwar, Jan Steckel, Siegfried Mercelis

Describir

Este artículo amplía LiDAR-BIND, un marco modular de fusión multimodal para integrar sensores heterogéneos (radar y sonar) en un espacio latente basado en LiDAR, con un mecanismo que refuerza explícitamente la consistencia temporal. Presentamos tres contribuciones: primero, la similitud de incrustación temporal, que alinea representaciones latentes continuas; segundo, una pérdida de traslación alineada con el movimiento, que iguala los desplazamientos entre el LiDAR predicho y el real; y tercero, la fusión temporal basada en ventanas mediante un módulo temporal especializado. También actualizamos la arquitectura del modelo para preservar mejor la estructura espacial. La evaluación de la conversión de radar/sonar a LiDAR demuestra que la consistencia temporal y espacial mejorada reduce los errores absolutos de trayectoria y mejora la precisión del mapa de ocupación en SLAM basado en cartógrafos. Para evaluar el rendimiento de SLAM, proponemos diversas métricas basadas en la Distancia de Movimiento de Video Frecuente (FVMD) y la métrica de distancia pico de correlación. El LiDAR-BIND temporal propuesto (LiDAR-BIND-T) mejora significativamente la estabilidad temporal al tiempo que mantiene la fusión de la modalidad plug-and-play, mejorando así la robustez y el rendimiento del SLAM posterior.

Takeaways, Limitations

Takeaways:
LiDAR-BIND-T con coherencia temporal mejorada proporciona un rendimiento SLAM mejorado.
Una nueva métrica temporal (métrica de distancia máxima de correlación basada en FVMD) es útil para evaluar el rendimiento de SLAM.
Rendimiento mejorado manteniendo un marco de fusión multimodal, modular y listo para usar.
Mayor aplicabilidad práctica al reducir el error de trayectoria absoluto y mejorar la precisión del mapa de ocupación.
Limitations:
Se necesitan más investigaciones para investigar la generalidad de la métrica temporal propuesta y su aplicabilidad a otros sistemas SLAM.
Estos son resultados de evaluación del desempeño para sensores y entornos específicos, y el desempeño de generalización en otros entornos requiere mayor verificación.
Sólo se presenta la evaluación de SLAM basada en Cartographer, y no se presentan los resultados de la aplicación a otros algoritmos SLAM.
👍