본 논문은 밀리미터파 FMCW 레이더 마이크로 도플러 스펙트로그램을 사용하여 다중 클래스 표적 분류를 위한 새로운 Temporal MDS-Vision Transformer (T-MDS-ViT)를 제안한다. 패치 임베딩과 교차축 어텐션 메커니즘을 통해 스택된 RVA 시공간 텐서를 처리하여 여러 프레임에 걸쳐 MDS 데이터의 순차적 특성을 명시적으로 모델링하는 변환기 기반 아키텍처를 설계했다. T-MDS-ViT는 표적 중첩 및 부분적 가림에서도 분리성을 유지하기 위해 어텐션 레이어 대응에서 이동성 인식 제약을 활용한다. 또한, 어텐션 레이어가 MDS 표현의 특징적인 고에너지 영역에 어떻게 집중하는지, 그리고 이들이 클래스별 운동학적 특징에 미치는 영향을 설명 가능한 메커니즘을 통해 조사했다. 제안된 프레임워크는 분류 정확도 측면에서 기존 CNN 기반 방법보다 뛰어나며, 더 나은 데이터 효율성과 실시간 배포 가능성을 달성했다.