본 논문은 데이터 중복이 기계 학습 모델의 언러닝(unlearning) 과정에 미치는 영향을 종합적으로 조사한 최초의 연구입니다. 기존 연구는 학습 데이터셋의 중복 데이터가 모델 성능과 데이터 프라이버시에 영향을 미친다는 것을 보여주었지만, 언러닝 과정에 대한 영향은 거의 연구되지 않았습니다. 본 논문에서는 표준 기계 언러닝뿐만 아니라 연합 학습(Federated Learning) 및 강화 학습(Reinforcement Learning) 언러닝 패러다임에서 데이터 중복의 역할을 조사합니다. 특히, 적대자(adversary)가 목표 모델의 학습 세트의 일부를 복제하여 학습 세트에 통합하고, 학습 후 해당 복제된 부분을 언러닝하도록 모델 소유자에게 요청하여, 언러닝된 모델에 대한 영향을 분석하는 시나리오를 제시합니다. 또한, 중복 제거 기술의 탐지를 회피하기 위해 세 가지 새로운 유사 중복(near-duplication) 방법을 제안하고, 중복 제거 기술이 적용될 때 언러닝 과정에 미치는 영향을 검토합니다. 실험 결과, 재학습(retraining) 방법이 특정 조건에서는 효과적인 언러닝을 수행하지 못하고, 중복 데이터의 언러닝이 특정 시나리오에서 모델 성능 저하를 초래하며, 정교하게 제작된 중복 데이터는 중복 제거 방법으로 탐지를 회피할 수 있다는 것을 밝힙니다.