본 논문은 AI 생성 이미지의 저작권 및 출처 보호를 위한 보이지 않는 워터마킹 기술의 취약성을 다룹니다. 최신 워터마킹 기법은 일반적인 이미지 조작에도 견딜 수 있도록 설계된 의미론적 신호(content-aware patterns)를 삽입하지만, 적응형 공격에 대한 강력함은 아직 충분히 탐구되지 않았습니다. 본 연구는 이전에 보고되지 않은 취약성을 밝히고, 이미지의 의미를 유지하면서 최첨단 의미론적 및 보이지 않는 워터마크를 제거하는 3단계 레이블 없는 공격 기법인 SemanticRegen을 제시합니다. SemanticRegen은 (i) 비전-언어 모델을 사용하여 세밀한 캡션을 얻고, (ii) 제로샷 분할을 통해 전경 마스크를 추출하고, (iii) LLM으로 안내되는 확산 모델을 통해 배경만을 채움으로써 중요한 객체와 스타일 단서를 보존합니다. TreeRing, StegaStamp, StableSig, DWT/DCT 등 네 가지 워터마킹 시스템에 걸쳐 1,000개의 프롬프트를 평가한 결과, SemanticRegen은 의미론적 TreeRing 워터마크를 제거하는 유일한 방법이며(p = 0.10 > 0.05), 나머지 기법에 대해서는 비트 정확도를 0.75 미만으로 줄이면서 높은 지각 품질(masked SSIM = 0.94 +/- 0.01)을 유지합니다. 또한 전경 영역 내 충실도를 정량화하기 위해 masked SSIM(mSSIM)을 도입하여 기존 확산 기반 공격보다 최대 12% 높은 mSSIM을 달성함을 보여줍니다. 결론적으로, 현재 워터마킹 방어와 적응형 의미론 인식 공격자의 능력 사이에 심각한 차이가 있음을 강조하고, 콘텐츠를 보존하는 재생 공격에 강력한 워터마킹 알고리즘의 필요성을 강조합니다.