본 논문은 기존의 머신 언러닝(MU) 연구가 주로 단일 모달리티에 집중된 것과 달리, 시각 및 텍스트 정보를 결합하는 다중 모달리티 모델인 CLIP에서의 머신 언러닝 문제를 다룹니다. 특히, CLIP에서 특정 데이터를 제거하는 과정에서 모델 성능 저하를 최소화하기 위해 새로운 방법인 CLIPErase를 제시합니다. CLIPErase는 잊어야 할 정보와 유지해야 할 정보 간의 연관성을 분리하고 선택적으로 망각하는 세 가지 모듈(Forgetting Module, Retention Module, Consistency Module)로 구성되어 있습니다. CIFAR-100 및 Flickr30K 데이터셋을 이용한 실험 결과, CLIPErase는 지정된 연관성을 효과적으로 잊는 동시에 기존 모델의 성능을 유지하는 것을 보여줍니다. 이는 특히 제로샷 학습 환경에서 다중 모달리티 샘플에 대한 효과적인 머신 언러닝을 가능하게 합니다.