본 논문은 양자 신경망(QNN)을 활용한 양자 비전 트랜스포머(QViT) 모델을 제안하고, 8개의 다양한 생의학 영상 데이터셋을 사용하여 기존의 비전 트랜스포머(ViT) 모델과 성능을 비교 분석합니다. QViT는 자기 주의 메커니즘 내 선형 계층을 QNN으로 대체하여 향상된 특징 표현을 얻고, 모델 복잡도를 크게 줄이는 것을 목표로 합니다. 논문에서는 처음부터 학습한 모델과 고품질 교사 모델로부터 지식 증류(KD)를 사용하여 사전 훈련된 모델 모두를 평가하여 QViT의 성능을 검증합니다.