Benchmarking Ophthalmology Foundation Models for Clinically Significant Age Macular Degeneration Detection
Created by
Haebom
저자
Benjamin A. Cohen, Jonathan Fhima, Meishar Meisel, Baskin Meital, Luis Filipe Nakayama, Eran Berkowitz, Joachim A. Behar
개요
본 논문은 자가 지도 학습(SSL)을 통해 사전 훈련된 Vision Transformers (ViTs)를 사용하여 7개의 디지털 안저 영상(DFI) 데이터셋(총 70,000개의 전문가 주석 이미지)에서 중등도~후기 노인성 황반변성(AMD) 식별 과제에 대한 성능을 벤치마킹했습니다. 자연 이미지로 사전 훈련된 iBOT이 도메인 특정 모델 및 사전 훈련되지 않은 기준 ViT-L보다 우수한 일반화 성능(AUROC 0.80-0.97)을 보였으며, 도메인 특정 사전 훈련의 필요성에 의문을 제기했습니다. 또한, 브라질의 AMD 레이블이 있는 DFI 데이터셋 BRAMD (n=587)을 공개했습니다.
시사점, 한계점
•
시사점:
◦
자연 이미지로 사전 훈련된 기본 모델(foundation model)이 안저 영상에서 AMD 식별 과제에 있어 도메인 특정 모델보다 우수한 성능을 보임을 확인했습니다.
◦
도메인 특정 사전 훈련이 항상 필요한 것은 아님을 시사합니다.
◦
iBOT 모델의 우수한 일반화 성능은 다양한 의료 영상 분석 분야에 적용 가능성을 제시합니다.
◦
BRAMD 데이터셋 공개를 통해 AMD 연구에 기여합니다.
•
한계점:
◦
벤치마킹에 사용된 DFI 데이터셋의 다양성 및 규모에 대한 추가적인 검토가 필요할 수 있습니다.
◦
다른 AMD 하위 유형이나 다른 안과 질환에 대한 일반화 성능은 추가 연구가 필요합니다.
◦
iBOT 모델의 우수성이 모든 안저 영상 분석 과제에 적용될 수 있는지는 추가 연구가 필요합니다.