Dans cet article, nous proposons CoCMT, un nouveau cadre pour améliorer l'efficacité de la communication dans les systèmes de perception coopérative multi-agents. Alors que les systèmes existants souffrent d'un surcoût de communication élevé en transmettant l'intégralité de la carte des caractéristiques intermédiaires, CoCMT transmet sélectivement uniquement les informations essentielles grâce à une approche basée sur les requêtes d'objets. Cela comprend la fusion efficace des requêtes d'objets provenant de plusieurs agents à l'aide d'un transformateur de requêtes efficace (EQFormer) et l'application d'une technique de supervision approfondie qui améliore la synergie entre les étapes pour améliorer les performances. Les résultats expérimentaux sur les jeux de données OPV2V et V2V4Real montrent que CoCMT surpasse les méthodes de pointe existantes tout en réduisant considérablement le volume de communication. En particulier, le modèle utilisant les 50 requêtes d'objets les plus performantes sur le jeu de données V2V4Real ne nécessite que 0,416 Mo de bande passante, soit 83 fois moins que la méthode la plus performante existante, tout en améliorant l'indice AP70 de 1,1 %. Cette amélioration de l'efficacité permet la construction de systèmes de perception coopérative pratiques sans compromettre la précision, même dans des environnements à bande passante limitée.