본 논문은 CLIP의 이미지 인코더에서 어텐션 헤드의 역할을 연구하고, 특정 헤드가 표현에 해로운 영향을 미치는 것을 발견했다. 이를 해결하기 위해 어텐션 가중치를 직접 조작하여 선택된 헤드를 억제하는 간단하고 효과적인 어텐션 제거 기법(AAT)을 제안한다. AAT는 다양한 적용 시나리오에 맞춰 두 가지 보완적인 전략을 통합하여, 최소한의 오버헤드로 유해한 헤드를 체계적으로 식별하고 제거할 수 있도록 한다. 실험 결과, AAT는 다양한 도메인에서 다운스트림 성능을 일관되게 향상시키고, 교차 모달 검색 벤치마크에서 최대 11.1%의 리콜을 향상시켰다.