Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Segmentation d'images avec de grands modèles linguistiques : une étude prospective sur les systèmes de transport intelligents

Created by
  • Haebom

Auteur

Sanjeda Akter, Ibne Farabi Shihab, Anuj Sharma

Contour

Cet article examine systématiquement l'impact de l'intégration de modèles de langage à grande échelle (MLL) à la vision par ordinateur sur des tâches perceptuelles telles que la segmentation d'images. En nous concentrant spécifiquement sur les systèmes de transport intelligents (STI), nous présentons les applications, les défis et les orientations futures de la segmentation d'images basée sur les MLL dans les STI, où une compréhension précise des scènes est cruciale pour la sécurité et l'efficacité. Nous classons différentes approches de segmentation d'images basées sur les MLL en fonction de leurs mécanismes d'incitation et de leurs architectures principales, et mettons en évidence les innovations qui améliorent la compréhension des scènes routières pour la conduite autonome, la surveillance du trafic et la maintenance des infrastructures. Enfin, nous identifions les principaux défis tels que la performance en temps réel et la fiabilité critique pour la sécurité, et présentons une perspective sur l'IA explicable et centrée sur l'humain, essentielle au déploiement réussi de cette technologie dans les systèmes de transport de nouvelle génération.

Takeaways, Limitations

Takeaways:
Les avancées innovantes dans la technologie de segmentation d'images dans le domaine des STI sont présentées grâce à l'intégration du LLM et de la vision par ordinateur.
Exploration de l'application de la segmentation d'images basée sur LLM à diverses applications ITS, notamment la conduite autonome, la surveillance du trafic et la maintenance des infrastructures.
Fournir une classification et une analyse systématiques des approches de segmentation d'images basées sur LLM.
Présentation d’une direction pour le développement d’une IA explicable et centrée sur l’humain.
Limitations:
Difficultés à garantir des performances en temps réel et une fiabilité critique pour la sécurité
Manque de méthodologies concrètes pour développer une IA explicable et centrée sur l’humain.
👍