Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Marking Code Without Breaking It: Code Watermarking for Detecting LLM-Generated Code

Created by
  • Haebom

저자

Jungin Kim, Shinwoo Park, Yo-Sub Han

개요

LLM이 생성한 코드에 워터마크를 삽입하여 식별하는 것은 기능적 정확성을 유지하는 데 어려움이 있다. 기존 방법은 높은 엔트로피 토큰에 워터마크를 삽입하면 출력 품질이 효과적으로 유지된다고 가정하지만, 구문적 중요 토큰(예: 키워드)이 종종 가장 높은 엔트로피를 나타내 기존 방법이 논리적 손상에 취약하다는 문제점이 있다. 본 논문에서는 비구문적 토큰에만 워터마크를 삽입하여 코드 무결성을 보존하는 구문 인식 워터마킹 방법인 STONE을 제시한다. 또한, 정확성, 탐지 가능성, 비인지성을 균형 있게 고려하는 포괄적인 프레임워크인 STEM을 소개한다. Python, C++, Java에 대해 STONE은 정확성을 유지하고, 강력한 탐지 가능성을 유지하며, 최소한의 오버헤드로 균형 잡힌 성능을 달성한다.

시사점, 한계점

시사점:
구문 인식 워터마킹 방법(STONE) 제시: 비구문적 토큰에 워터마크를 삽입하여 코드의 정확성을 보존.
종합적인 평가 프레임워크(STEM) 도입: 정확성, 탐지 가능성, 비인지성을 균형 있게 고려.
다양한 프로그래밍 언어(Python, C++, Java)에 대한 성능 검증.
한계점:
연구에서 다루지 않은 다른 프로그래밍 언어 또는 코드 생성 모델에 대한 성능 평가 필요.
워터마킹 기법의 잠재적인 보안 취약점 분석 필요.
실제 환경에서의 활용성 및 확장성에 대한 추가 연구 필요.
👍