잠재 확산 모델(LDM)의 생성 과정에 워터마킹을 통합하면 생성된 콘텐츠의 탐지 및 귀속이 간소화됩니다. Tree-Rings 및 Gaussian Shading과 같은 의미론적 워터마크는 구현이 용이하고 다양한 섭동에 대해 매우 강력한 새로운 종류의 워터마킹 기술을 나타냅니다. 그러나 본 연구는 의미론적 워터마크의 근본적인 보안 취약성을 보여줍니다. 연구진은 공격자가 서로 다른 잠재 공간과 아키텍처(UNet 대 DiT)를 가진 모델이라도 관련 없는 모델을 활용하여 강력하고 현실적인 위조 공격을 수행할 수 있음을 보여줍니다. 구체적으로, 두 가지 워터마크 위조 공격을 설계했습니다. 첫 번째는 임의 이미지의 잠재 표현을 조작하여 워터마크된 이미지의 잠재 표현에 가깝게 만들어 관련 없는 LDM에서 실제 이미지에 대상 워터마크를 각인합니다. 이 기술을 워터마크 제거에도 사용할 수 있음을 보여줍니다. 두 번째 공격은 워터마크된 이미지를 반전시키고 임의 프롬프트로 다시 생성하여 대상 워터마크가 있는 새로운 이미지를 생성합니다. 두 공격 모두 대상 워터마크가 있는 단일 참조 이미지만 필요합니다. 전반적으로, 연구 결과는 공격자가 현실적인 조건에서 이러한 워터마크를 쉽게 위조하거나 제거할 수 있음을 밝혀냄으로써 의미론적 워터마크의 적용 가능성에 의문을 제기합니다.