본 논문에서는 AI 모델이 생성한 코드와 사람이 작성한 코드를 구별하는 문제에 대해 다룹니다. CodeLlama 34B, Codestral 22B, Gemini 1.5 Flash를 사용하여 2,828개의 AI 생성 Python 코드와 4,755개의 사람이 작성한 Python 코드로 구성된 AIGCodeSet 데이터셋을 제시합니다. 또한, 기본적인 탐지 방법을 사용한 실험 결과를 공유하며, 베이지안 분류기가 다른 모델보다 성능이 우수함을 보여줍니다.