본 논문은 언어 모델(LM)의 재무 분석 능력을 평가하기 위해 공개 금융 데이터셋을 사용하여 LM의 자체 설명(self-explanation)의 사실성과 인과성을 정량적으로 평가했습니다. 기존 연구들이 주로 분류 성능에 초점을 맞춘 것과 달리, 본 연구는 LM의 자체 설명의 질에 주목하여 분류 정확도와 자체 설명의 사실성 및 인과성 간의 통계적 유의미한 관계를 밝혔습니다. 이를 통해 자체 설명을 이용한 분류 신뢰도 추정 및 독점적 추론을 통한 분류 최적화에 대한 경험적 기반을 마련했습니다.