본 논문은 대규모 언어 모델(LLM)이 생성한 한국어 텍스트를 탐지하기 위한 새로운 벤치마크 데이터셋 KatFish와 탐지 모델 KatFishNet을 제안한다. 기존 연구들이 주로 영어에 집중한 것과 달리, 한국어의 고유한 형태소 및 구문적 특징을 고려하여, 공백 규칙, 형태소 다양성, 쉼표 사용 등의 언어적 차이를 분석하고 이를 기반으로 KatFishNet을 개발하였다. KatFishNet은 기존 최고 성능 모델보다 평균 19.78% 높은 AUROC를 달성했다.