본 논문은 해석 가능한 머신러닝 모델과 블랙박스 모델의 성능과 해석 가능성 간의 상충 관계를 비교 분석한 연구입니다. 특히, 리뷰로부터 등급을 추론하는 자연어 처리(NLP) 작업에 초점을 맞춰 여러 모델들을 비교 분석하고, 해석 가능성과 성능 간의 상충 관계를 시각화하는 새로운 지표인 Composite Interpretability (CI)를 제시합니다. 연구 결과, 일반적으로 해석 가능성이 낮을수록 성능이 향상되지만, 이 관계가 단조롭지는 않으며 해석 가능한 모델이 더 유리한 경우도 있음을 보여줍니다.