본 논문은 의료 영상 기반 심층 학습 진단 AI 시스템의 블랙박스 문제와 신뢰성 부족을 해결하기 위해, 컨포멀 분석을 활용하여 비전 트랜스포머(ViT) 기반 기초 모델(Google DermFoundation)의 예측 불확실성을 정량화하는 연구를 제시합니다. 특히, 성별, 연령, 민족과 같은 환자 인구 통계학적 특징에 따른 차이를 분석하고, 피부 병변 분류 작업에 대한 여러 공개 벤치마크 데이터셋을 사용합니다. 모델 훈련 중 모델-애그노스틱 동적 F1-점수 기반 샘플링을 사용하여 클래스 불균형을 안정화하고, 이러한 편향 완화 단계의 유무에 따른 불확실성 정량화(UQ)에 대한 영향을 조사합니다. 이는 기초 모델의 특징 임베딩의 강건성을 평가하고 임상 AI의 신뢰성과 공정성을 향상시키는 공정성 지표로 활용될 수 있음을 보여줍니다.