Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Vision par ordinateur avancée pour extraire des trajectoires de véhicules géoréférencées à partir d'images de drones

Created by
  • Haebom

Auteur

Robert Fonod, Haechan Cho, Hwasoo Yeo, Nikolas Geroliminis

Contour

Cet article présente un cadre d'extraction de trajectoires de véhicules géoréférencées à partir d'images de drones prises à haute altitude. Pour relever les principaux défis de la surveillance du trafic urbain et pallier les limites des systèmes terrestres existants, nous intégrons un détecteur d'objets optimisé pour les vues aériennes à haute altitude, une nouvelle technique de stabilisation de trajectoire utilisant les cadres de délimitation des véhicules comme masques d'exclusion lors de l'enregistrement des images, ainsi qu'une stratégie de géoréférencement basée sur des orthophotos et des images maîtresses qui améliore la cohérence de l'alignement entre plusieurs points de vue de drones. De plus, une estimation robuste de la taille des véhicules et des capacités détaillées de segmentation routière permettent une analyse complète du trafic. Nous avons mené une expérience multi-drones sur 20 intersections du quartier d'affaires international de Songdo, en Corée du Sud, pendant quatre jours, collectant environ 12 To de données vidéo 4K. Nous avons généré deux jeux de données de haute qualité : le « Songdo Traffic Dataset » contenant environ 700 000 trajectoires de véhicules uniques et le « Songdo Vision Dataset » contenant plus de 5 000 images annotées par des humains, contenant environ 300 000 instances de véhicules réparties en quatre classes. La comparaison avec des données de capteurs de haute précision provenant de véhicules d'essai instrumentés met en évidence la précision et la cohérence du pipeline d'extraction en milieu urbain dense. En publiant les jeux de données « Songdo Traffic » et « Songdo Vision » ainsi que le code source complet du pipeline d'extraction, nous établissons une nouvelle norme en matière de qualité, de reproductibilité et d'évolutivité des données dans la recherche sur les transports. Nous démontrons le potentiel de l'intégration de la technologie des drones et de la vision par ordinateur avancée pour une surveillance précise et rentable du trafic urbain, fournissant ainsi une ressource précieuse pour le développement de systèmes de transport intelligents et l'amélioration des stratégies de gestion du trafic.

Takeaways, Limitations

Takeaways:
Présentation d'un cadre précis et efficace de surveillance du trafic urbain à l'aide d'images de drones à haute altitude
Publication de données de trafic urbain de grande qualité et à grande échelle (Songdo Traffic, Songdo Vision)
Présenter la possibilité de développer des systèmes de transport intelligents grâce à l'intégration de la technologie des drones et de la vision par ordinateur
Présentation d'une méthodologie de recherche hautement reproductible et évolutive
Limitations:
La zone de recherche est limitée à une zone spécifique (quartier d'affaires international de Songdo). La généralisation à d'autres zones doit être vérifiée.
Absence d’évaluation des performances du système dans des conditions météorologiques défavorables (pluie, neige, etc.).
Absence d’analyse détaillée des coûts et des ressources nécessaires à l’exploitation des drones et au traitement des données.
Une réflexion plus approfondie pourrait être nécessaire concernant la diversité des types de véhicules et des mouvements.
👍