Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

CoCMT : Transformateur intermodal efficace en communication pour une perception collaborative

Created by
  • Haebom

Auteur

Rujia Wang, Xiangbo Gao, Hao Xiang, Runsheng Xu, Zhengzhong Tu

Contour

Dans cet article, nous proposons CoCMT, un nouveau cadre pour améliorer l'efficacité de la communication dans les systèmes de perception coopérative multi-agents. Alors que les systèmes existants souffrent d'un surcoût de communication élevé en transmettant l'intégralité de la carte des caractéristiques intermédiaires, CoCMT ​​transmet sélectivement uniquement les informations essentielles grâce à une approche basée sur les requêtes d'objets. Cela comprend la fusion efficace des requêtes d'objets provenant de plusieurs agents à l'aide d'un transformateur de requêtes efficace (EQFormer) et l'application d'une technique de supervision approfondie qui améliore la synergie entre les étapes pour améliorer les performances. Les résultats expérimentaux sur les jeux de données OPV2V et V2V4Real montrent que CoCMT ​​surpasse les méthodes de pointe existantes tout en réduisant considérablement le volume de communication. En particulier, le modèle utilisant les 50 requêtes d'objets les plus performantes sur le jeu de données V2V4Real ne nécessite que 0,416 Mo de bande passante, soit 83 fois moins que la méthode la plus performante existante, tout en améliorant l'indice AP70 de 1,1 %. Cette amélioration de l'efficacité permet la construction de systèmes de perception coopérative pratiques sans compromettre la précision, même dans des environnements à bande passante limitée.

Takeaways, Limitations

Takeaways:
Nous démontrons que l’efficacité de la communication peut être considérablement améliorée grâce à un cadre de perception collaborative basé sur des requêtes d’objets.
Il permet la construction de systèmes de perception collaborative multi-agents de haute précision, même dans des environnements à bande passante limitée.
Nous présentons une nouvelle méthode pour améliorer les performances de perception collaborative multi-agents en utilisant EQFormer et des techniques de supervision approfondie.
Augmente l’applicabilité des systèmes de perception collaborative dans des environnements réels.
Limitations:
Les performances de la méthode proposée peuvent dépendre du jeu de données. Des expériences complémentaires sur différents jeux de données et environnements sont nécessaires.
Des recherches supplémentaires peuvent être nécessaires pour optimiser les stratégies de sélection des requêtes d’objets.
L'analyse de la dégradation potentielle des performances dans des environnements complexes ou lorsqu'un grand nombre d'agents sont présents est nécessaire.
👍