다중 에이전트 강화 학습(MARL)은 여러 에이전트가 다양한 도메인에서 순차적인 의사 결정을 수행할 수 있도록 하여 최근 많은 관심을 받고 있습니다. 그러나 대부분의 기존 설명 방법은 중앙 집중식 MARL에 초점을 맞추고 있으며, 분산 환경의 불확실성과 비결정론성을 해결하지 못합니다. 본 논문에서는 분산 MARL 정책에서 작업 순서와 에이전트 협업을 포착하는 정책 요약을 생성하는 방법과 특정 에이전트 행동에 대한 사용자 쿼리(언제, 왜 안 되는지, 무엇인지)에 대한 쿼리 기반 설명을 제안합니다. 우리는 4개의 MARL 도메인과 2개의 분산 MARL 알고리즘에서 접근 방식을 평가하여 일반화 가능성과 계산 효율성을 입증했습니다. 사용자 연구에 따르면, 우리의 요약 및 설명은 사용자 질문 답변 성능을 크게 향상시키고 이해도 및 만족도와 같은 지표에서 주관적인 평가를 향상시킵니다.