본 논문은 LLM 평가의 공정성을 저해하는 데이터 오염 문제를 해결하기 위해, 실제 세계 지식을 활용하여 데이터를 자동 업데이트하는 오염 저항적 평가 전략인 CoreEval을 제안한다. CoreEval은 원본 데이터에서 개체 관계를 추출하고 GDELT 데이터베이스를 사용하여 최신 지식을 검색한다. 검색된 지식을 재맥락화하여 원본 데이터와 통합하고, 의미론적 일관성과 작업 관련성을 향상시키기 위해 데이터를 구체화 및 재구성한다. 최종적으로, 강력한 데이터 반사 메커니즘을 사용하여 레이블을 반복적으로 검증하고 구체화하여 업데이트된 데이터와 원본 데이터 간의 일관성을 보장한다.