Cet article propose une approche multi-agents pour surmonter les limites du flux de données linéaire conventionnel (localisation sonore → séparation sonore → extraction d'informations) en analyse de scènes auditives (ASA). La méthode conventionnelle présente des problèmes de temps de traitement longs et d'erreurs de localisation qui affectent considérablement les étapes suivantes. Le système d'analyse de scènes auditives multi-agents (MASA) proposé effectue les tâches de localisation, de séparation et de classification en parallèle et compense les erreurs locales grâce à une boucle de rétroaction entre les agents (par exemple, en corrigeant les erreurs de localisation à l'aide des résultats de séparation et en réduisant la sensibilité de la localisation aux interférences à l'aide des résultats de classification). Il offre robustesse et rapidité de réponse sans augmenter la complexité de calcul, et est fourni sous forme de framework open source utilisant JACK et ROS2 pour prendre en charge l'ajout d'agents définis par l'utilisateur.