본 논문은 대규모 언어 모델(LLM)의 사전 훈련 과정에서 발생하는 데이터 오염 문제를 해결하기 위해, 데이터 오염의 영향을 완화하는 동적 데이터 평가 방법인 AdEval(Alignment-based Dynamic Evaluation)을 제안합니다. AdEval은 평가의 신뢰성을 높이기 위해 데이터 정렬 기반의 동적 평가를 수행합니다. 다양한 데이터셋에 대한 실험 결과를 통해 AdEval이 데이터 오염의 영향을 효과적으로 줄이고, 평가 과정의 공정성과 신뢰성을 향상시킨다는 것을 보여줍니다.