본 논문은 대규모 언어 모델(LLM)의 악용 가능성에 대한 우려를 해결하기 위해 텍스트에 워터마크를 삽입하여 소유권 확인을 가능하게 하는 기술을 제안한다. 기존 방법들은 주로 수정 공격에 대한 방어에 초점을 맞추고 다른 스푸핑 공격은 간과하는데, 예를 들어 공격자는 워터마크의 존재를 손상시키지 않고도 유해한 콘텐츠를 생성하기 위해 워터마크된 텍스트를 변경할 수 있다. 이는 LLM 서비스 제공업체에 심각한 위협이 되므로 수정 감지와 생성된 텍스트 감지를 동시에 달성하는 것이 중요하다. 따라서 본 논문에서는 수정에 민감한 객관적인 워터마크에 대한 텍스트 수정 감지 기법을 제안한다. 워터마크 감지에 포함되지 않은 토큰의 수를 측정하는 "버려진 토큰"이라는 새로운 지표를 도입하여 수정 발생 시 이 지표가 변화하는 것을 수정의 증거로 사용한다. 또한 워터마크 감지 프로세스를 개선하고 객관적인 워터마크를 위한 새로운 방법을 제시한다. 실험 결과, 워터마크를 통해 수정 감지와 생성된 텍스트 감지라는 효과적인 이중 감지 기능을 달성할 수 있음을 보여준다.