본 논문은 텍스트-이미지 모델과 같은 다중 모달 확산 모델의 취약점을 탐구하고, 특히 부적절한 콘텐츠 생성에 초점을 맞춥니다. 텍스트와 이미지 간의 불충분한 정렬을 지적하며, 입력 프롬프트는 변경하지 않고 이미지만 조작하여 콘텐츠를 조작하는 새로운 공격 방법인 PReMA (Prompt-Restricted Multi-modal Attack)를 제안합니다. 이 공격은 이미지 페인팅 및 스타일 변환과 같은 작업에서 모델의 출력을 효과적으로 조작할 수 있음을 입증합니다.