Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Segmentación de imágenes con modelos de lenguaje de gran tamaño: un estudio con perspectivas para sistemas de transporte inteligentes

Created by
  • Haebom

Autor

Sanjeda Akter, Ibne Farabi Shihab, Anuj Sharma

Describir

Este artículo examina sistemáticamente el impacto de la integración de modelos de lenguaje a gran escala (LLM) con visión artificial en tareas perceptivas como la segmentación de imágenes. Centrándonos específicamente en los Sistemas Inteligentes de Transporte (ITS), presentamos las aplicaciones, los desafíos y las futuras direcciones de la segmentación de imágenes basada en LLM en ITS, donde la comprensión precisa de la escena es crucial para la seguridad y la eficiencia. Clasificamos diversos enfoques de segmentación de imágenes basados ​​en LLM según sus mecanismos de activación y arquitecturas centrales, y destacamos las innovaciones que mejoran la comprensión de la escena vial para la conducción autónoma, la vigilancia del tráfico y el mantenimiento de infraestructuras. Finalmente, identificamos desafíos clave como el rendimiento en tiempo real y la fiabilidad crítica para la seguridad, y presentamos una perspectiva sobre la IA explicable y centrada en el ser humano, esencial para el despliegue exitoso de esta tecnología en los sistemas de transporte de próxima generación.

Takeaways, Limitations

Takeaways:
Se presentan avances innovadores en la tecnología de segmentación de imágenes en el campo ITS a través de la integración de LLM y visión por computadora.
Exploración de la aplicación de la segmentación de imágenes basada en LLM a diversas aplicaciones ITS, incluida la conducción autónoma, el monitoreo del tráfico y el mantenimiento de infraestructura.
Proporcionar una clasificación y análisis sistemáticos de enfoques de segmentación de imágenes basados ​​en LLM.
Presentando una dirección para el desarrollo de una IA explicable y centrada en el ser humano.
Limitations:
Dificultades para garantizar el rendimiento en tiempo real y la confiabilidad crítica para la seguridad
Falta de metodologías concretas para desarrollar una IA explicable y centrada en el ser humano.
👍