본 논문은 의료 영상에서의 알고리즘적 편향이 건강 불평등을 야기할 수 있으며, 특히 분할 작업에서 그 원인이 잘 이해되지 않고 있음을 지적한다. 유방암 분할을 예시로 들어, 모델이 어린 환자에게서 유의미한 성능 차이를 보인다는 점을 밝힌다. MAMA-MIA 데이터셋을 분석하여 연령 관련 편향의 정량적 기준선을 설정하고, 검증을 위한 레이블의 체계적인 결함이 모델의 실제 편향을 잘못 나타내는 'Biased Ruler' 효과를 보인다고 주장한다. 또한, 편향이 낮은 품질의 어노테이션(레이블 편향)에서 기인하는지 또는 본질적으로 어려운 이미지 특성에서 기인하는지를 규명하기 위해 실험을 수행한다.