생성 AI의 급속한 발전으로 딥페이크가 정교해짐에 따라 법 집행 및 공공 신뢰에 대한 과제가 증가하고 있다. 본 논문은 고차원 잠재 공간 표현과 Multi-Agent Adversarial Reinforcement Learning (MAARL) 패러다임을 활용하여 강력하고 적응 가능한 워터마킹 접근 방식을 개발하는 새로운 딥러닝 프레임워크를 소개한다. 특히, 잠재 공간에서 작동하여 높은 수준의 이미지 의미를 포착하고 메시지 인코딩 및 추출을 정밀하게 제어하는 학습 가능한 워터마크 임베더를 개발했다. MAARL 패러다임은 적대적 공격자 에이전트가 시뮬레이션한 양성 및 악성 이미지 조작의 동적 커리큘럼과 상호 작용하여 학습 가능한 워터마킹 에이전트가 견고성과 취약성 사이의 최적의 균형을 유지하도록 한다. CelebA 및 CelebA-HQ 벤치마크에 대한 포괄적인 평가는 제안된 방법이 기존 접근 방식보다 우수하며, 어려운 조작 시나리오에서 CelebA에서 4.5% 이상, CelebA-HQ에서 5.3% 이상의 개선을 달성했음을 보여준다.