본 논문은 기울기 기반 멤버십 추론 테스트(gMINT)를 대규모 언어 모델(LLM) 기반 텍스트 분류에 적용하고 연구한 결과를 제시합니다. gMINT는 기계 학습 모델의 학습에 특정 데이터가 사용되었는지 여부를 판별하는 일반적인 접근 방식이며, 본 논문에서는 자연어 처리(NLP) 분야에 대한 적용에 중점을 둡니다. 기울기 기반 분석을 사용하여 gMINT 모델은 특정 데이터 샘플이 언어 모델 학습 단계에 포함되었는지 여부를 식별하여 기계 학습에서의 데이터 프라이버시에 대한 우려를 해결합니다. 7개의 Transformer 기반 모델과 250만 개 이상의 문장으로 구성된 6개의 데이터 세트를 사용하여 텍스트 분류 작업에 대해 방법을 평가했습니다. 실험 결과는 데이터 크기와 모델 아키텍처에 따라 AUC 점수가 85%~99%에 달하는 gMINT의 강력함을 보여줍니다. 이러한 결과는 gMINT가 기계 학습 모델 감사를 위한 확장 가능하고 신뢰할 수 있는 도구로서 AI/NLP 기술의 배포에서 투명성을 보장하고, 민감한 데이터를 보호하며, 윤리적 준수를 촉진할 가능성을 강조합니다.