본 논문은 mRAG(multi-modal retrieval-augmented generation) 시스템의 토큰 오버헤드와 계산 비용 문제를 해결하기 위해, 다중 모달 다중 에이전트 계층적 통신 그래프 프루닝 프레임워크인 M$^3$Prune을 제안합니다. M$^3$Prune은 중복된 엣지를 제거하여 성능과 토큰 사용량 사이의 균형을 유지합니다. 텍스트 및 시각적 모달리티 내에서 엣지 선택을 수행하고, 이를 기반으로 동적 통신 토폴로지를 구축한 후, 중복 엣지를 점진적으로 제거하여 효율적인 계층 구조를 얻습니다. 실험 결과는 M$^3$Prune이 단일 에이전트 및 기존 다중 에이전트 시스템보다 우수한 성능을 보이며 토큰 소비를 크게 줄인다는 것을 보여줍니다.