본 논문은 다수 에이전트 시스템에서 강화 학습 정책의 안전성을 보장하기 위한 새로운 다중 에이전트 실드(shield) 기반 접근법을 제안합니다. 기존 실드 기반 접근법의 확장성 문제를 해결하기 위해, 각 에이전트에 대한 개별 실드를 계산하는 방법을 제시합니다. 전역적 안전 규격을 각 에이전트의 지역적 의무로 분해하기 위해 가정-보장 추론(assume-guarantee reasoning)을 적용하고, 이를 위한 건전한 증명 규칙을 제시합니다. 실험 결과, 제안된 방법이 계산 시간을 크게 단축(hours to seconds)하고 학습 수렴 속도를 향상시키는 것을 보여줍니다.