본 논문은 대규모 언어 모델(LLM)을 이용한 코드 생성으로 인한 지적 재산권 침해 문제에 대한 해결책을 제시한다. LLM이 기존 코드를 변형하여 저작권 침해 가능성을 높이는 문제를 해결하기 위해, LLM이 생성한 코드가 원본 코드를 표절한 것인지 판별하는 작업과 표절에 사용된 LLM을 식별하는 작업을 제안한다. 다양한 LLM을 사용하여 인간이 작성한 코드와 LLM이 변형한 코드 쌍으로 구성된 LPcode 데이터셋을 구축하고, 명명 규칙, 코드 구조, 가독성 등 코딩 스타일의 차이를 통계적으로 분석하여 LPcodedec라는 탐지 방법을 개발하였다. LPcodedec는 두 가지 작업에서 기존 최고 성능 기준 모델보다 F1 점수를 각각 2.64%와 15.17% 향상시키고, 속도는 각각 1,343배와 213배 향상시켰다. 코드와 데이터는 깃허브에 공개되어 있다.