본 논문은 지시어 미세 조정된 대규모 언어 모델(LLM) 출력에서 훈련 데이터의 기여도를 추정하기 위해 문맥 내 학습과 프롬프트 엔지니어링을 활용하는 방법을 연구합니다. 두 가지 새로운 접근 방식을 제안하는데, 첫째는 문맥 제공 유무에 따른 LLM 출력의 차이를 측정하는 유사성 기반 접근 방식이고, 둘째는 데이터 기여도 점수 식별 문제를 행렬 분해 작업으로 구성하는 혼합 분포 모델 접근 방식입니다. 실험적 비교를 통해 혼합 모델 접근 방식이 문맥 내 학습에서 검색 노이즈에 더 강건하며, 데이터 기여도를 더 안정적으로 추정할 수 있음을 보여줍니다.