본 논문은 대규모 언어 모델(LLM)의 사전 훈련 과정에서 발생하는 데이터 오염 문제를 해결하기 위해, 평가의 신뢰성을 높이는 동적 데이터 평가 방법인 AdEval(Alignment-based Dynamic Evaluation)을 제안합니다. AdEval은 데이터 오염의 영향을 완화하여 평가의 공정성과 신뢰성을 향상시키는 것을 목표로 합니다. 여러 데이터셋에 대한 실험 결과를 통해 AdEval이 평가 결과에 대한 데이터 오염의 영향을 효과적으로 줄이는 것을 보여줍니다.