본 논문은 딥러닝 모델 학습에 사용되는 데이터에 대한 사용자의 통제력 부족 문제를 해결하기 위해, MembershipTracker라는 데이터 감사 도구를 제안합니다. MembershipTracker는 사용자 데이터에 작은 변화를 주어 모델이 이를 기억하도록 하고, Membership Inference(MI) 기반 검증 과정을 통해 해당 데이터가 모델 학습에 사용되었는지 감지합니다. 소량의 데이터 마킹(학습 데이터의 0.005%~0.1%)만으로도 높은 정확도(평균 0% FPR@100% TPR)로 무단 사용 여부를 감지할 수 있으며, ImageNet-1k와 같은 대규모 데이터셋에서도 효과적임을 보여줍니다. 또한 다양한 대응책에 대한 평가도 수행합니다.