본 논문은 차세대 Wi-Fi(IEEE 802.11bn 등)에서 중요한 역할을 할 것으로 예상되는 다중 접속 지점 조정(MAPC)과 인공지능/기계학습(AI/ML)을 기반으로, 공간 재사용(SR) 최적화를 위한 온라인 학습 기반의 조정 솔루션을 탐구한다. 특히, 여러 의사결정 에이전트가 MAPC 프레임워크를 활용하여 공존 네트워크의 SR 매개변수를 동시에 구성하는 다중 에이전트 다중 팔 밴딧(MA-MAB) 설정에 초점을 맞춰 다양한 알고리즘과 보상 공유 메커니즘을 연구한다. Komondor 시뮬레이터를 사용하여 다양한 MA-MAB 구현을 평가한 결과, 조정된 MAB에 의해 가능해진 AI 기반 SR이 기존 Wi-Fi 운영 방식보다 네트워크 성능을 향상시킬 수 있음을 보여준다. 평균 처리량은 15% 증가하고, 네트워크 전반의 최소 처리량이 210% 증가하여 공정성이 향상되는 반면, 최대 접속 지연 시간은 3ms 미만으로 유지된다.