本論文は、聴覚シーン分析(ASA)における既存の線形データフロー(音の位置決定→音の分離→情報抽出)方式の限界を克服するためのマルチエージェントアプローチを提案する。従来の方法は処理時間が長く、位置決めエラーが後続のステップに大きな影響を与えるという問題を抱えている。本論文で提案するマルチエージェント聴覚シーン分析(MASA)システムは、位置確認、分離、分類作業を並列に行い、エージェント間フィードバックループを介して(例えば、分離結果を用いた位置確認誤差の修正、分類結果を用いた干渉に対する位置特定感度の低下)、地域誤差を補正する。これは計算の複雑さを増やすことなく堅牢性と迅速な応答時間を提供し、JACKとROS2を使用したオープンソースフレームワークで提供され、カスタムエージェントの追加をサポートします。