Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

To Retrieve or Not to Retrieve? Uncertainty Detection for Dynamic Retrieval Augmented Generation

Created by
  • Haebom
Category
Empty

저자

Kaustubh D. Dhole

개요

본 논문은 Retrieval-Augmented Generation(RAG)에서 동적 검색(dynamic retrieval)을 활용하여 장문 질의응답의 효율성을 높이는 방법을 제시합니다. 기존 RAG 모델들이 결정적으로 검색을 수행하는 것과 달리, LLM이 필요한 지식을 갖고 있지 않을 때만 검색을 수행하는 방식을 제안하며, 이를 위해 다양한 불확실성 탐지 방법들을 연구합니다. Degree Matrix Jaccard와 Eccentricity와 같은 불확실성 측정 지표를 평가하여, 검색 호출 횟수를 절반 가까이 줄이면서 정확도 저하를 최소화할 수 있음을 보여줍니다.

시사점, 한계점

시사점:
동적 검색을 활용한 RAG 모델의 효율성 향상 가능성 제시.
불확실성 탐지 기법을 통해 불필요한 검색 호출 감소 가능성 확인.
Degree Matrix Jaccard와 Eccentricity 지표의 효과적인 활용 가능성 제시.
한계점:
제시된 불확실성 탐지 기법의 일반화 가능성에 대한 추가 연구 필요.
다양한 유형의 장문 질의응답에 대한 성능 평가 추가 필요.
다른 불확실성 탐지 기법과의 비교 분석 추가 필요.
👍