본 논문은 망막 질환 분류를 위한 심층 학습 모델의 해석력 향상과 효율성 증대를 목표로 한다. 기존 연구의 한계인 이미지 데이터 의존성, 낮은 해석력, 의료 전문가의 단순 주석자 역할에 대한 문제점을 해결하기 위해, GPT 모델의 지식 기반을 활용하여 망막 질환의 해석 가능한 개념을 추출하고, 이를 프롬프트 학습에 통합하는 비전-언어(VL) 모델을 제안한다. 이를 통해 안저 이미지와 관련 개념을 모두 사용하여 망막 질환 분류 성능을 향상시키고, 특히 소수 샘플 학습 및 제로샷 학습(새로운 질병 검출)에서 성능 향상을 보였다. 두 개의 다양한 안저 이미지 데이터셋에 대한 광범위한 평가 결과, 제안된 방법은 16-shot 학습에서 평균 5.8%, 제로샷 검출에서 평균 2.7%의 평균 정밀도 향상을 보였다.