본 논문은 의료 영상 분석을 위한 신뢰할 수 있는 인공지능(AI) 모델 개발에 있어, 대규모 다양한 라벨링 데이터셋의 중요성과 연합 학습(FL)의 한계를 다룹니다. 특히, 데이터 분포가 독립적이고 동일하게 분포되지 않은(non-IID) 환경, 즉 기관 간 데이터의 대표성 차이가 큰 상황에서 FL의 성능 저하 문제에 주목합니다. 기존 연구가 주로 성인 데이터에 집중한 점을 고려하여, 추가적인 non-IID 변동성을 야기하는 소아 데이터를 포함하여 성인 흉부 X선 사진 398,523장과 소아 흉부 X선 사진 9,125장을 분석했습니다. 일반 목적의 자기 지도 학습 기반 이미지 표현을 전이 학습에 활용하여 폐렴 및 이상 없는 경우를 분류하는 비전 트랜스포머 모델을 사용했습니다. 그 결과, FL은 소규모 성인 데이터셋에서는 성능을 향상시켰지만, 대규모 데이터셋과 소아 데이터셋에서는 성능 저하를 보였습니다. 하지만 자기 지도 학습 가중치를 FL에 적용함으로써 소아 데이터셋을 포함한 대부분의 성인 데이터셋에서 성능이 향상되었습니다. 이는 일반 목적의 자기 지도 학습 기반 이미지 표현이 임상 FL 응용에서 non-IID 문제를 해결하고 소아 의료 분야의 데이터 부족 및 변동성 문제를 해결하는 데 유용함을 시사합니다.