본 논문은 방사선과 보고서 자동 생성의 어려움을 해결하기 위해 다중 시점 대조 학습과 환자 특이적 지식을 통합한 새로운 흉부 X선 보고서 생성 프레임워크인 EVOKE를 제안합니다. EVOKE는 다중 시점 흉부 X선 사진과 보고서를 정렬하는 다중 시점 대조 학습 방법과 환자의 증상 설명 등의 정보를 통합하여 정확하고 일관된 보고서 생성을 유도하는 지식 기반 보고서 생성 모듈로 구성됩니다. 공개 데이터를 사용하여 Multi-view CXR 및 Two-view CXR 데이터셋을 구축하고, MIMIC-CXR, MIMIC-ABN, Multi-view CXR, Two-view CXR 데이터셋에서 기존 최고 성능 모델을 능가하는 결과를 보였습니다. 구체적으로 MIMIC-CXR에서 2.9% F₁ RadGraph 향상, MIMIC-ABN에서 7.3% BLEU-1 향상, Multi-view CXR에서 3.1% BLEU-4 향상, Two-view CXR에서 8.2% F₁,mic-14 CheXbert 향상을 달성했습니다.