Sign In

SAGE: A Framework of Precise Retrieval for RAG

Created by
  • Haebom
Category
Empty

저자

Jintao Zhang, Guoliang Li, Jinyang Su

개요

본 논문은 기존 Retrieval-augmented generation (RAG) 모델의 질의응답(QA) 과제 수행 시 발생하는 오류를 해결하기 위해 새로운 RAG 프레임워크인 SAGE를 제안합니다. SAGE는 기존 RAG의 두 가지 주요 한계점, 즉 (1) 의미를 고려하지 않은 단순한 코퍼스 분할로 인한 질문과 단락 간 상관관계 저하 및 (2) 검색된 맥락의 양에 따른 필수 정보 누락과 무관한 정보 포함의 상충 문제를 해결합니다. 이를 위해 SAGE는 의미 기반 코퍼스 분할 모델을 학습하고, 관련성 점수 감소 속도에 기반한 청크 선택 알고리즘을 설계하며, LLM을 이용해 검색된 청크의 양을 조절하는 메커니즘을 도입합니다. 실험 결과, SAGE는 기존 모델들에 비해 QA 품질을 평균 61.25% 향상시켰으며, 불필요한 맥락 검색 감소를 통해 토큰 소모 비용을 평균 49.41% 절감하는 효율성을 보였습니다.

시사점, 한계점

시사점:
의미 기반 코퍼스 분할과 동적인 청크 선택 알고리즘을 통해 RAG의 정확도를 크게 향상시킬 수 있음을 보여줌.
LLM의 맥락 조절 기능을 활용하여 효율적인 QA 수행이 가능함을 제시.
RAG 모델의 비용 효율성을 향상시킬 수 있는 새로운 방법을 제시.
한계점:
제안된 SAGE 프레임워크의 일반화 성능에 대한 추가적인 실험이 필요.
다양한 종류의 코퍼스 및 질문 유형에 대한 성능 평가가 부족.
의미 기반 코퍼스 분할 모델의 학습 과정에 대한 자세한 설명이 부족.
👍