Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

ObjectReact: Aprendizaje del control relativo a objetos para la navegación visual

Created by
  • Haebom

Autor

Sourav Garg, Dustin Craggs, Vineeth Bhat, Lachlan Mares, Stefan Podgorski, Madhava Krishna, Feras Dayoub, Ian Reid

Describir

La navegación visual, que utiliza una sola cámara y un mapa topológico, se ha convertido en una alternativa atractiva a los métodos que requieren sensores adicionales y mapas 3D. Esto se logra típicamente mediante un enfoque "relativo a la imagen", que estima el control a partir de pares de imágenes de observación actuales e imágenes de subobjetivos. Sin embargo, dado que las imágenes están estrictamente vinculadas a la pose e implementación del agente, las representaciones del mundo a nivel de imagen son limitadas. Por el contrario, los objetos son propiedades del mapa, lo que proporciona una representación del mundo independiente de la implementación y la trayectoria. En este estudio, presentamos un nuevo paradigma para el aprendizaje de control "relativo a objetos" que presenta varias propiedades deseables: a) permite explorar nuevas rutas sin imitar estrictamente la experiencia previa; b) permite separar el problema de predicción del control del problema de coincidencia de imágenes; y c) permite alcanzar un alto grado de invariancia en las configuraciones de entrenamiento-prueba y mapeo-ejecución. Proponemos una representación de mapa topológico en forma de grafo de escena 3D "relativo" para obtener costos de planificación de rutas globales a nivel de objeto más informativos. Entrenamos un controlador local llamado "ObjectReact", condicionado a una representación "WayObject Costmap" de alto nivel que no requiere entrada RGB explícita. Demostramos la ventaja del aprendizaje de control relativo a objetos sobre el control relativo a imágenes en diversas tareas de navegación que desafían las variaciones de altura del sensor y la comprensión espacial básica (por ejemplo, la exploración de trayectorias de mapas en dirección opuesta). También demostramos que la política de solo simulación se generaliza correctamente a entornos interiores reales.

Takeaways, Limitations

Takeaways:
Presentamos un nuevo paradigma de control relativo a objetos que permite una navegación visual robusta en diversos entornos utilizando solo una cámara y un mapa de fase.
Construimos sistemas de navegación más eficientes y robustos al separar el problema de coincidencia de imágenes del problema de predicción de control.
Muestra un excelente rendimiento de generalización incluso en diversas situaciones, como cambios de altura del sensor y navegación inversa.
Las políticas entrenadas en simulación se transfieren bien a entornos del mundo real.
Limitations:
El rendimiento del método propuesto depende en gran medida de la precisión y la integridad del mapa topológico. Los mapas inexactos o incompletos pueden reducir el rendimiento de la navegación.
Las dificultades en el reconocimiento y seguimiento de objetos en entornos complejos y concurridos pueden afectar el rendimiento de la navegación.
El rendimiento de generalización en entornos del mundo real requiere más pruebas y evaluaciones en diversas condiciones ambientales y de iluminación.
Se proporcionan el código y los materiales de apoyo, pero es posible que carezcan de instrucciones detalladas para la implementación y el despliegue reales.
👍