오픈소스 대규모 언어 모델(LLM)의 악용 방지를 위해 워터마킹 기법 개발이 중요해짐에 따라, 본 연구는 Llama3와 같은 오픈소스 LLM에 대한 두 가지 악용 시나리오(지적재산권 침해 및 LLM 사용 위반)를 정의하고, 추론 시 워터마킹 증류 및 백도어 워터마킹의 적용을 탐색합니다. 다양한 실제 추가 미세 조정 시나리오가 워터마킹에 미치는 영향과 워터마킹이 LLM 성능에 미치는 영향을 평가하기 위한 포괄적인 평가 방법을 제안하고, 백도어 워터마킹이 지적재산권 침해 탐지에 효과적이며, 추론 시 워터마킹 증류는 두 시나리오 모두에 적용 가능하지만 추가 미세 조정에 대한 강건성이 떨어지고 LLM 성능에 더 큰 영향을 미친다는 것을 실험을 통해 보여줍니다. 결론적으로 오픈소스 LLM의 악용을 탐지하기 위한 더욱 고급 워터마킹 방법에 대한 연구가 중요한 미래 방향이라고 제시합니다.