본 논문은 설명 가능한 AI(XAI)에서 특징 귀속 방법 평가의 어려움을 다룬다. 연구자들은 일반적으로 기준 진실이 없을 때 섭동 기반 지표에 의존하지만, 최근 연구에 따르면 이러한 평가 지표는 동일한 데이터셋 내에서 예측된 클래스에 따라 성능이 다를 수 있음을 보여준다. 이러한 "클래스 종속적 평가 효과"는 섭동 분석이 귀속 품질을 신뢰할 수 있게 측정하는지에 대한 의문을 제기하며, XAI 방법 개발과 평가 기술의 신뢰성에 직접적인 영향을 미친다. 본 연구는 기준 진실 특징 위치를 알고 있는 합성 시계열 데이터를 사용한 통제된 실험을 통해 이러한 클래스 종속적 효과가 발생하는 조건을 조사한다. 이진 분류 작업에서 특징 유형과 클래스 대조를 체계적으로 변화시킨 후, 여러 귀속 방법을 사용하여 섭동 기반 저하 점수와 기준 진실 기반 정밀도-재현율 지표를 비교한다.