Cet article propose une approche multi-agents pour surmonter les limites des systèmes d'analyse de scène auditive linéaire (ASA) conventionnels. Les systèmes ASA conventionnels traitent séquentiellement la localisation, la segmentation et la classification des sources sonores, ce qui entraîne des temps de réponse longs et un impact significatif sur les étapes suivantes en raison d'erreurs précoces. Le système d'analyse de scène auditive multi-agents (MASA) proposé effectue les tâches de localisation, de segmentation et de classification en parallèle et compense les erreurs grâce à une boucle de rétroaction réciproque. Par exemple, la qualité des résultats de séparation est utilisée pour corriger les erreurs de localisation, et les résultats de classification pour réduire la sensibilité de la localisation aux interférences. Cela rend MASA robuste aux erreurs locales et offre des temps de réponse rapides sans augmenter la complexité. Le système MASA proposé est fourni sous forme de framework ouvert utilisant JACK (Acoustic Acquisition and Reproduction) et ROS2 (Inter-Agent Communication), permettant une intégration aisée des agents utilisateurs.