자율 에이전트의 안전성과 시스템 목표와의 정렬을 보장하기 위해, 특히 다중 에이전트 환경에서 실시간 감독 메커니즘이 중요해지고 있습니다. 본 논문에서는 환경에 전담 감독 에이전트(Enforcement Agent, EA)를 통합하여 다른 에이전트를 모니터링하고, 잘못된 행동을 감지하고, 실시간으로 수정하는 EA 프레임워크를 제시합니다. 드론 시뮬레이션을 통해 0, 1, 2개의 EA 구성으로 90회 에피소드에 걸쳐 평가한 결과, EA 추가는 시스템 안전성을 크게 향상시키는 것으로 나타났습니다. EA가 없을 때 성공률은 0.0%였으나, EA 1개일 때 7.4%, 2개일 때 26.7%로 증가했습니다. 또한, 작동 수명과 악의적인 드론의 개선율도 향상되었습니다. 이는 다중 에이전트 시스템의 정렬 및 복원력 향상을 위한 경량의 실시간 감독의 잠재력을 강조합니다.