본 논문은 대규모 언어 모델(LLM)이 생성한 텍스트와 인간이 작성한 텍스트를 구별하는 것이 어려워짐에 따라, 신뢰할 수 있는 LLM 생성 텍스트 탐지기의 필요성이 증대되었다는 점을 배경으로 한다. 기존 탐지기는 분포 외 데이터 및 공격 데이터에 대한 낮은 강건성과 해석 가능한 증거 제공의 어려움이라는 한계를 가지고 있다. 이에 본 논문에서는 입력 텍스트를 생성했을 가능성이 있는 프롬프트를 식별하는 프롬프트 반전기와 입력 텍스트가 예측된 프롬프트와 얼마나 일치하는지 확률을 검토하는 두 개의 구별기를 포함하는 새로운 프레임워크인 IPAD(Inverse Prompt for AI Detection)를 제안한다. 실험 결과, IPAD는 기존 최고 성능 모델보다 분포 내 데이터에서 평균 재현율 9.05%, 분포 외 데이터에서 AUROC 12.93%, 공격 데이터에서 AUROC 5.48% 향상된 성능을 보였으며, 구조화된 데이터셋에서도 강건한 성능을 나타냈다. 또한, 의사결정 과정의 증거를 직접 확인할 수 있도록 함으로써 AI 탐지 신뢰성을 높였다는 점을 보여주는 해석성 평가도 수행되었다.