본 논문은 LGBTQ+ 공동체를 겨냥한 증오성 밈이 자막이나 이미지를 약간만 바꿔도 탐지 시스템을 우회하는 문제를 다룹니다. PrideMM 데이터셋을 사용하여 네 가지 현실적인 자막 공격과 세 가지 일반적인 이미지 손상을 조합하여 최초의 강건성 벤치마크를 구축했습니다. MemeCLIP과 MemeBLIP2라는 두 가지 최첨단 탐지기를 사례 연구로 사용하여, MemeBLIP2의 복원력을 향상시키는 경량 Text Denoising Adapter (TDA)를 제시합니다. 실험 결과, MemeCLIP은 더 완만하게 성능이 저하되는 반면, MemeBLIP2는 특히 언어 처리를 방해하는 자막 편집에 민감한 것으로 나타났습니다. 그러나 TDA를 추가하면 이러한 약점이 해결될 뿐만 아니라 MemeBLIP2가 전반적으로 가장 강건한 모델이 됩니다. 추가 분석을 통해 모든 시스템이 텍스트에 크게 의존하지만, 아키텍처 선택과 사전 훈련 데이터가 강건성에 상당한 영향을 미친다는 것을 밝혔습니다. 본 벤치마크는 현재 다중 모달 안전 모델의 취약점을 보여주고, TDA와 같은 표적화된 경량 모듈이 더 강력한 방어를 위한 효과적인 방법임을 보여줍니다.