Bài báo này đề xuất một phương pháp tiếp cận đa tác nhân để khắc phục những hạn chế của các hệ thống phân tích cảnh thính giác tuyến tính (ASA) thông thường. Các hệ thống ASA thông thường xử lý tuần tự việc định vị, phân đoạn và phân loại nguồn âm thanh, dẫn đến thời gian phản hồi dài và tác động đáng kể đến các giai đoạn tiếp theo do lỗi ở các giai đoạn đầu. Hệ thống phân tích cảnh thính giác đa tác nhân (MASA) được đề xuất thực hiện các nhiệm vụ định vị, phân đoạn và phân loại song song và bù trừ lỗi thông qua vòng phản hồi qua lại. Ví dụ, chất lượng của kết quả phân tách được sử dụng để sửa lỗi định vị và kết quả phân loại được sử dụng để giảm độ nhạy của định vị với nhiễu. Điều này làm cho MASA mạnh mẽ với các lỗi cục bộ và cung cấp thời gian phản hồi nhanh mà không làm tăng độ phức tạp. Hệ thống MASA được đề xuất được cung cấp dưới dạng một khuôn khổ mở sử dụng JACK (Thu thập và Tái tạo Âm thanh) và ROS2 (Giao tiếp giữa các tác nhân), cho phép tích hợp tác nhân người dùng dễ dàng.