본 논문은 이미지-투-이미지(I2I) 확산 모델의 안전성 문제, 특히 NSFW 콘텐츠 생성 가능성에 대한 취약성을 밝힙니다. 기존의 텍스트 기반 악성 프롬프트 공격은 쉽게 탐지되지만, 본 논문에서는 입력 이미지 자체를 조작하여 NSFW 콘텐츠 생성을 유도하는 새로운 공격 기법인 AdvI2I를 제안합니다. AdvI2I는 생성자를 최적화하여 안전한 잠재 확산(SLD) 등 기존 방어 메커니즘을 우회하며, 더욱 강화된 AdvI2I-Adaptive는 방어 기법에 적응하고 악성 이미지와 NSFW 개념 임베딩 간 유사성을 최소화하여 공격의 성공률을 높입니다. 실험 결과, 두 기법 모두 기존 안전 장치를 효과적으로 우회함을 보여주며, I2I 확산 모델의 안전성 강화 필요성을 강조합니다.