본 논문은 멀티모달 대형 언어 모델(MLLM)의 추론 과정을 분석하기 위해 '모달리티 사보타주'라는 진단적 실패 모드를 소개합니다. MLLM의 예측에서 어떤 모달리티가 주도적인 역할을 하는지, 갈등은 어떻게 해결되는지, 또는 특정 스트림이 언제 지배적인지를 파악하기 어렵다는 문제의식에서 출발하여, 각 모달리티를 에이전트로 취급하고, 후보 레이블과 자체 평가를 생성하는 경량화된 모델 독립적인 평가 레이어를 제안합니다. 이 레이어는 간단한 융합 메커니즘을 통해 정확한 결과를 지지하는 모달리티(공헌자)와 잘못된 결과를 유도하는 모달리티(사보타주)를 드러냅니다. 멀티모달 감정 인식 벤치마크에 적용하여 데이터 세트 아티팩트 또는 모델의 한계에서 비롯될 수 있는 실패를 밝혀내는 체계적인 신뢰성 프로파일을 제시하며, 융합 역학에 대한 감사를 지원하고 개입 방안을 제시하는 진단 프레임워크를 제공합니다.