본 논문은 기존의 gradient-based Membership Inference Test (gMINT)를 대규모 언어 모델(LLM) 기반 텍스트 분류에 적용하여, 특정 데이터가 LLM 학습에 사용되었는지 여부를 판별하는 방법을 제시합니다. gMINT는 기울기 기반 분석을 통해 학습 데이터의 구성 여부를 식별하며, 7가지 Transformer 기반 모델과 250만 문장 이상의 6개 데이터셋을 사용하여 텍스트 분류 작업에서 평가되었습니다. 실험 결과, AUC 점수가 데이터 크기 및 모델 구조에 따라 85%~99%의 성능을 보이며, LLM의 데이터 프라이버시 문제 해결에 기여할 수 있음을 보여줍니다.