Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Principled Context Engineering for RAG: Statistical Guarantees via Conformal Prediction

Created by
  • Haebom
Category
Empty

저자

Debashish Chakraborty, Eugene Yang, Daniel Khashabi, Dawn Lawrie, Kevin Duh

개요

본 논문은 검색 증강 생성(RAG) 모델에서 컨텍스트 엔지니어링을 위한 컨포멀 예측을 활용하는 새로운 접근 방식을 제시한다. RAG는 검색된 증거를 통합하여 LLM의 사실적 근거를 향상시키지만, 긴 컨텍스트 또는 노이즈가 있는 컨텍스트는 모델의 효과적인 주의 범위를 초과하여 정확도를 저하시킨다. 이 논문은 컨포멀 예측을 통해 컨텍스트를 필터링하여 관련 없는 내용을 제거하고, 관련 증거의 재현율을 유지하면서 모델의 성능을 향상시키는 방법을 제안한다. 임베딩 및 LLM 기반 스코어링 함수를 사용하여 NeuCLIR 및 RAGTIME 데이터셋에서 실험을 진행했으며, 컨포멀 필터링이 지정된 관련 스니펫의 비율을 보존하면서, 필터링되지 않은 검색에 비해 유지된 컨텍스트를 2~3배 줄이는 것을 확인했다. 특히, NeuCLIR 데이터셋에서 엄격한 필터링 하에서 ARGUE F1으로 측정된 다운스트림 사실적 정확도가 향상되었으며, 이는 대부분의 삭제된 자료가 중복되거나 관련이 없음을 시사한다.

시사점, 한계점

시사점:
컨포멀 예측을 활용한 컨텍스트 엔지니어링은 RAG 모델에서 신뢰할 수 있는, 범위 제어된 컨텍스트 감소를 가능하게 한다.
모델에 독립적인, 원칙적인 컨텍스트 엔지니어링 접근 방식을 제공한다.
관련 없는 컨텍스트를 제거하여 모델 정확도를 향상시키고, 계산 비용을 절감할 수 있다.
지정된 관련 스니펫의 비율을 보존하여 중요한 정보를 잃지 않도록 보장한다.
한계점:
특정 데이터셋(NeuCLIR, RAGTIME)에 대한 실험 결과에 국한된다.
다양한 RAG 모델 및 스코어링 함수에 대한 추가적인 실험이 필요하다.
컨포멀 예측의 구체적인 구현 및 매개변수 설정에 대한 자세한 정보가 필요하다.
👍