본 논문은 인간의 의사결정을 돕는 AI 시스템 설계에 있어서, 지도 학습 모델의 훈련 및 평가에 필요한 레이블이 부재한 경우를 다룬다. 레이블을 추정하는 다양한 방법들이 검증되지 않은 가정이나 임의적인 선택을 포함하는 문제점을 지적하며, '레이블 불확정성(label indeterminacy)' 개념을 제시한다. 심정지 후 혼수 상태 환자의 회복 예측이라는 의료 분야의 실증 연구를 통해, 레이블이 알려진 환자에 대해서는 유사한 성능을 보이는 모델들도 레이블이 알려지지 않은 환자에 대한 예측에서는 큰 차이를 보일 수 있음을 보여준다. 이러한 고위험 상황에서 레이블 불확정성의 윤리적 함의를 제시하고, 평가, 보고, 설계에 대한 시사점을 논의한다.