본 논문은 대규모 다중 모달 AI 모델의 저작권 보호를 위한 새로운 백도어 워터마킹 프레임워크인 AGATE(Model-agnostic Black-box Backdoor Watermarking Framework)를 제안합니다. 기존 방법들의 취약점인 탐지 및 위조 가능성을 해결하기 위해, AGATE는 일반 데이터셋으로부터 은밀한 적대적 트리거를 생성하고, 모델 출력의 이상 탐지를 완화하기 위한 후처리 모듈을 도입합니다. 두 단계의 워터마킹 검증 과정을 통해 저작권 침해 여부를 판단하며, 다섯 개의 데이터셋에서 다중 모달 이미지-텍스트 검색 및 이미지 분류 작업에서 기존 최고 성능을 능가하는 결과를 보였습니다. 또한, 두 가지 적대적 공격 시나리오에서 AGATE의 강건성을 검증했습니다.