본 논문은 대규모 언어 모델(LLM)이 생성한 코드의 라이선스 준수 문제를 다룬다. LLM이 저작권이 있는 코드를 생성하면서 라이선스 정보를 제공하지 않아 지적재산권 침해 가능성이 발생하는 문제를 해결하기 위해, LLM이 생성한 코드의 라이선스 정보 정확성을 평가하는 벤치마크 LiCoEval을 제안한다. LiCoEval을 이용하여 14개의 LLM을 평가한 결과, 상위 LLM들조차도 기존 오픈소스 코드와 매우 유사한 코드를 상당한 비율(0.88%~2.01%)로 생성하며, 특히 복사금지 라이선스 코드에 대해 정확한 라이선스 정보를 제공하지 못하는 것으로 나타났다. 이는 AI 지원 소프트웨어 개발에서 라이선스 준수 기능 향상의 시급성을 강조한다.