본 논문은 신용 위험 평가에 사용되는 머신러닝 모델의 예측 정확도에 영향을 미치는 데이터 품질 문제(결측값, 노이즈 속성, 이상치, 레이블 오류)의 영향을 조사합니다. 오픈 소스 데이터 세트를 활용하여 Pucktrick 라이브러리를 사용해 의도적인 데이터 손상을 도입하고, Random Forest, SVM, Logistic Regression 등 10개의 모델의 견고성을 평가합니다. 실험 결과는 데이터 손상의 특성 및 심각도에 따라 모델 견고성에 상당한 차이가 있음을 보여줍니다.