본 논문은 의료 정보학에서 임상 의사결정을 지원하는 기계 학습(ML) 알고리즘의 성능이 인구 통계적 집단에 따라 다르게 나타나는 현상, 특히 훈련 데이터셋에서 소외된 집단의 과소표현으로 인한 성별 및 연령 관련 불평등에 초점을 맞추고 있다. 25,000명 이상의 만성 질환자 데이터를 분석하여 기존의 정확도 및 데이터 복잡도와 체계적인 임의성을 결합한 새로운 분석 프레임워크를 제시한다. 분석 결과, 남성에게 유리한 경향을 보이는 약한 성별 관련 불균형과 연령에 따른 상당한 차이(젊은 환자에게 더 높은 정확도)를 발견했다. 특히 고령 환자는 7개 데이터셋에서 예측 정확도가 일관되지 않았으며, 이는 더 높은 데이터 복잡도와 낮은 모델 성능과 관련이 있었다. 이를 통해 훈련 데이터의 대표성만으로는 공정한 결과를 보장할 수 없으며, 임상 환경에 모델을 배포하기 전에 모델의 임의성을 해결해야 함을 강조한다.