본 논문은 이미지 분류를 위한 심층 신경망(DNN) 학습 시 중복 이미지 데이터의 영향에 대한 종합적인 연구를 제시합니다. 기존 연구에서 언어 모델의 중복 데이터 제거가 성능 향상에 기여하는 것을 보였지만, 이미지 분류 DNN에서 중복 이미지의 영향은 거의 연구되지 않았습니다. 본 연구는 중복 이미지가 모델 학습 효율을 저하시키고, 이미지 분류기의 정확도를 낮출 수 있음을 밝힙니다. 특히, 클래스 간 중복 데이터 분포가 불균일하거나, 적대적 학습 모델에서 중복이 발생하는 경우 정확도 저하가 더욱 두드러집니다. 균일한 중복 증가 또한 정확도 향상으로 이어지지 않습니다.