본 논문은 블랙박스 기계학습 모델의 예측을 설명하는 모델-애그노스틱 지역 설명 방법을 제안합니다. 입력 특징의 중첩 구조(고차원 및 저차원 특징으로 구성)를 고려하여 고차원 특징 기여도(HiFAs)와 저차원 특징 기여도(LoFAs)를 동시에 추정합니다. HiFAs와 LoFAs 간의 일관성을 제약조건으로 도입하여 두 기여도를 효과적으로 추정하고, 모델에 대한 질의 횟수를 줄이면서 블랙박스 모델에 충실하고 서로 일관성 있는 설명을 생성합니다. 다중 인스턴스 학습의 이미지 분류 및 언어 모델을 사용한 텍스트 분류 실험을 통해 제안된 방법의 정확성과 블랙박스 모델 동작에 대한 충실성, 그리고 일관된 설명 제공 능력을 입증합니다.