Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Retrieval-Augmented Generation as Noisy In-Context Learning: A Unified Theory and Risk Bounds

Created by
  • Haebom

저자

Yang Guo, Yutian Tao, Yifei Ming, Robert D. Nowak, Yingyu Liang

개요

본 논문은 Retrieval-augmented generation (RAG)의 이론적 측면을 최초로 탐구한 연구입니다. 특히, in-context linear regression 상황에서 RAG에 대한 유한 표본 일반화 경계를 제시하고 정확한 bias-variance tradeoff를 도출했습니다. 회수된 텍스트를 쿼리에 종속적인 노이즈가 있는 in-context 예시로 보고, 기존의 in-context learning (ICL)과 표준 RAG를 극한 경우로 회복하는 프레임워크를 제시합니다. 이 분석을 통해 ICL과 달리 RAG에는 일반화 오차에 대한 고유한 상한선이 존재함을 시사하고, 훈련 데이터와 외부 말뭉치 모두에서의 정보 검색을 균일 및 비균일 RAG 노이즈를 도입하여 모델링합니다. 이론과 일치하게 Natural Questions 및 TriviaQA와 같은 일반적인 QA 벤치마크에서의 실험을 통해 ICL 및 RAG의 표본 효율성을 실증적으로 보여줍니다.

시사점, 한계점

시사점:
RAG에 대한 최초의 유한 표본 일반화 경계 및 bias-variance tradeoff 제시.
ICL과 RAG를 통합하는 새로운 프레임워크 제안.
RAG의 일반화 오차에 대한 고유한 상한선 존재를 밝힘.
훈련 데이터 및 외부 말뭉치 모두에서의 정보 검색 모델링.
ICL 및 RAG의 표본 효율성을 실증적으로 검증.
한계점:
분석이 in-context linear regression에 국한됨. 더 복잡한 모델이나 과제로의 일반화 필요.
실험이 특정 QA 벤치마크에 국한됨. 다양한 과제 및 데이터셋에 대한 추가 연구 필요.
RAG 노이즈 모델링의 현실적인 한계. 더 정교한 노이즈 모델 필요.
👍