본 논문은 기존 의료 진단 머신러닝 접근 방식의 한계인 상관관계에 기반한 오진 가능성을 지적하며, 특정 증상("가슴 통증")의 인과적 영향을 조사합니다. CausaLM 프레임워크를 활용하여 특정 개념을 "잊도록" 하는 반사실적 텍스트 표현을 생성하고, TReATE(Textual Representation-based Average Treatment Effect)를 통해 증상 유무가 모델의 진단 결과에 미치는 영향을 정량적으로 측정합니다. CONEXP과 같은 상관관계 기반 기준선과 비교 분석하여 임상 NLP 모델의 의사결정 과정에 대한 심층적인 통찰력을 제공하고, 더 신뢰할 수 있고 해석 가능하며 인과적으로 근거한 의료 의사결정 지원 도구 개발 가능성을 제시합니다.