본 논문은 피부암 진단을 위한 머신러닝 모델의 피부색 편향 문제를 다룬다. 기존의 많은 오픈소스 피부암 이미지 데이터셋은 밝은 피부색을 가진 국가에서 진행된 임상시험 결과를 기반으로 하여, 피부색 불균형 문제를 야기한다. 이러한 불균형으로 인해, 해당 데이터셋으로 학습된 모델은 밝은 피부색에 대해서는 성능이 우수하지만, 어두운 피부색에 대해서는 성능이 저하될 수 있다. 연구진은 ISIC 아카이브의 이미지 서브셋을 이용하여, 피부색 불균형 데이터셋과 균형 데이터셋을 사용하여 딥러닝 모델을 학습시켰고, 각 모델의 피부색에 따른 성능 차이(disparate impact)를 평가하였다. 결과적으로, 불균형 및 균형 데이터셋 모두에서 밝은 피부색에 대한 진단 성능이 더 높게 나타났으며, 이는 모델의 피부색 편향을 시사한다. 단순히 데이터셋의 피부색 불균형만이 편향의 원인이 아니라는 점을 밝히고, 추후 연구를 통해 편향을 해결할 수 있는 다른 기술이 필요함을 제시한다.