Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Grid2Guide: Modelo de lenguaje pequeño habilitado para navegación en interiores

작성자
  • Haebom

Autor

Dr. Wasiul Haque, Sagar Dasgupta, Mizanur Rahman

Describir

Este artículo presenta un marco de navegación híbrido, Grid2Guide, que proporciona una navegación fiable en interiores complejos sin necesidad de guías de posicionamiento externas ni infraestructura dedicada. Combina el algoritmo de búsqueda A* y un Modelo de Lenguaje Pequeño (SLM) para generar una guía de ruta clara y legible. Dado un mapa interior, se genera una matriz binaria de ocupación y el algoritmo A* calcula la ruta óptima entre el origen y el destino, generando pasos de navegación concisos basados ​​en texto. Estos pasos se traducen posteriormente a una guía en lenguaje natural mediante el SLM, lo que mejora la comprensión del usuario final. Evaluaciones experimentales en diversos escenarios interiores demuestran la eficacia de este método para generar una guía de navegación precisa y oportuna. Los resultados validan el enfoque propuesto como una solución ligera, sin infraestructura y en tiempo real para la navegación en interiores.

Takeaways, Limitations

Takeaways:
Presentamos un sistema de navegación interior ligero y sin infraestructura que combina el algoritmo A* y SLM.
Genere una guía de ruta precisa, legible y en tiempo real.
Verificación de rendimiento efectivo en diversos ambientes interiores.
Limitations:
Puede depender de la precisión del mapa interior proporcionado (los errores del mapa afectan la precisión de la navegación).
La naturalidad y precisión de la guía pueden variar según el rendimiento del SLM. (El rendimiento puede variar según la calidad de los datos de entrenamiento y el modelo del SLM).
Se necesita una evaluación adicional del desempeño en entornos complejos y concurridos.
Se necesita más investigación sobre la compatibilidad con varios idiomas.
👍