본 논문은 검색 증강 생성(RAG) 모델에서 컨텍스트 엔지니어링을 위한 컨포멀 예측을 활용하는 새로운 접근 방식을 제시한다. RAG는 검색된 증거를 통합하여 LLM의 사실적 근거를 향상시키지만, 긴 컨텍스트 또는 노이즈가 있는 컨텍스트는 모델의 효과적인 주의 범위를 초과하여 정확도를 저하시킨다. 이 논문은 컨포멀 예측을 통해 컨텍스트를 필터링하여 관련 없는 내용을 제거하고, 관련 증거의 재현율을 유지하면서 모델의 성능을 향상시키는 방법을 제안한다. 임베딩 및 LLM 기반 스코어링 함수를 사용하여 NeuCLIR 및 RAGTIME 데이터셋에서 실험을 진행했으며, 컨포멀 필터링이 지정된 관련 스니펫의 비율을 보존하면서, 필터링되지 않은 검색에 비해 유지된 컨텍스트를 2~3배 줄이는 것을 확인했다. 특히, NeuCLIR 데이터셋에서 엄격한 필터링 하에서 ARGUE F1으로 측정된 다운스트림 사실적 정확도가 향상되었으며, 이는 대부분의 삭제된 자료가 중복되거나 관련이 없음을 시사한다.