Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

A Systematic Literature Review of Retrieval-Augmented Generation: Techniques, Metrics, and Challenges

Created by
  • Haebom

저자

Andrew Brown, Muhammad Roman, Barry Devereux

개요

본 연구는 2020년부터 2025년 5월까지 발표된, 인용 횟수가 높은 검색 증강 생성(RAG) 관련 연구 128편에 대한 체계적 문헌 검토를 수행했습니다. ACM Digital Library, IEEE Xplore, Scopus, ScienceDirect, DBLP 등의 데이터베이스에서 자료를 수집하여 PRISMA 2020 프레임워크에 따라 분석했습니다. RAG는 신경망 기반 검색 모델과 생성형 언어 모델을 결합하여 최신 정보를 활용하면서 모델 가중치에 저장된 의미적 일반화를 유지하는 방식입니다. 본 연구는 데이터셋, 아키텍처, 평가 방식을 분류하고, RAG의 효과와 한계에 대한 경험적 증거를 종합하여 현재 연구 현황을 명확히 하고, 방법론적 격차를 강조하며, 미래 연구의 우선순위 방향을 제시합니다. 2025년에 발표된 논문의 경우 인용 횟수 기준을 낮춰 최근의 혁신적인 연구도 포함했습니다.

시사점, 한계점

시사점:
RAG의 효과와 한계에 대한 경험적 증거를 종합적으로 제시.
현재 RAG 연구의 현황과 방법론적 격차를 명확히 밝힘.
미래 RAG 연구의 우선순위 방향 제시.
인용 지연 편향을 완화하기 위한 전략 적용 (2025년 논문에 대한 인용 횟수 기준 완화).
한계점:
인용 횟수를 기준으로 선정하여, 인용 횟수가 낮더라도 중요한 연구가 누락될 가능성 존재.
특정 데이터베이스에 국한된 검색으로 인한 편향 가능성 존재.
연구의 범위가 2020년부터 2025년 5월까지로 한정되어 최신 동향을 완벽하게 반영하지 못할 가능성 존재.
👍