본 논문은 경도인지장애(MCI)를 조기에 진단하여 알츠하이머병(AD)으로의 진행을 늦추는 것을 목표로, 다중 모달 데이터의 선택 편향 및 변수 간 복잡한 관계로 인한 혼란 변수 문제를 해결하기 위한 새로운 시각-언어 인과 개입 프레임워크인 ADPC(Alzheimer's Disease Prediction with Cross-modal Causal Intervention)를 제안한다. ADPC는 대규모 언어 모델(LLM)을 사용하여 불완전하거나 불균형적인 데이터셋에서도 구조화된 텍스트 출력을 유지하며, MRI, fMRI 영상 및 LLM이 생성한 텍스트 데이터를 활용하여 인지 정상(CN), MCI, AD를 분류한다. 인과 개입을 통해 혼란 변수(예: 신경 영상 인공물, 연령 관련 생체 지표)의 영향을 제거하여 신뢰할 수 있는 결과를 얻는다. 실험 결과, ADPC는 대부분의 평가 지표에서 최첨단(SOTA) 성능을 달성하여 CN/MCI/AD 사례를 구분하는 데 탁월한 성능을 보였다. 이 연구는 신경 질환 진단을 위한 다중 모달 학습과 인과 추론 통합의 가능성을 보여준다.