본 논문은 고성능 딥러닝 모델 개발의 높은 자원 소모로 인해 모델 소유자가 모델을 공개적으로 배포하는 대신 MLaaS 플랫폼을 이용하는 현실에 주목합니다. 그러나 악의적인 사용자는 쿼리 인터페이스를 악용하여 모델 추출 공격을 수행하고 대상 모델의 기능을 로컬에서 재구성할 수 있습니다. 기존의 트리거 기반 워터마킹 기술은 추가적인 훈련이 필요하거나 고급 공격자에 취약하다는 한계를 가지고 있습니다. 본 논문에서는 모델 추출 공격에 강력한 플러그 앤 플레이 워터마킹 프레임워크인 Neural Honeytrace를 제안합니다. 정보 이론적 관점에서 워터마크 전송 모델을 공식화하고, 유사성 기반의 훈련이 필요 없는 워터마킹 방법과 분포 기반의 다단계 워터마크 정보 전송 전략을 소개합니다. 네 개의 데이터셋에 대한 실험 결과, Neural Honeytrace는 기존 방법보다 효율적이며 적응형 공격에 강합니다. 최악의 경우 t-Test 기반 저작권 주장에 필요한 샘플 수를 193,252개에서 1,857개로 줄이며, 훈련 비용은 전혀 들지 않습니다. 코드는 GitHub에서 공개됩니다.