본 논문은 구조적 자기 공명 영상(sMRI) 데이터와 딥러닝 기술을 활용하여 주요 우울 장애(MDD)를 자동 감지하는 새로운 파이프라인을 제시한다. Vision Transformers(ViTs)를 사용하여 3D 지역 임베딩을 추출하고, Graph Neural Network(GNN)을 활용하여 분류하는 통합 모델을 개발했다. 뇌 영역을 정의하기 위해 미리 정의된 뇌 아틀라스를 사용하는 아틀라스 기반 접근 방식과 균일하게 추출된 3D 패치로부터 ViTs가 직접 영역을 식별하도록 훈련하는 큐브 기반 방식을 탐구했다. 코사인 유사성 그래프를 생성하여 영역 간의 관계를 모델링하고 GNN 기반 분류를 수행했다. REST-meta-MDD 데이터셋을 사용한 10-겹 교차 검증 결과, 최고 78.98%의 정확도를 달성했으며, 아틀라스 기반 모델이 큐브 기반 접근 방식보다 우수한 성능을 보였다.