RAG+: Enhancing Retrieval-Augmented Generation with Application-Aware Reasoning
Created by
Haebom
저자
Yu Wang, Shiwan Zhao, Zhihu Wang, Yubo Zhang, Xicheng Zhang, Zhengfan Wang, Heyuan Huang, Ming Fan, Ting Liu
개요
본 논문은 지식 집약적 작업을 위한 대규모 언어 모델(LLM) 향상에 기본적인 역할을 하는 검색 증강 생성(RAG)을 통해 외부 지식을 통합하는 방법을 제시합니다. 기존 RAG 패러다임은 종종 지식 적용이라는 인지적 단계를 간과하여 검색된 사실과 특정 작업 추론 사이에 격차를 남깁니다. 본 논문에서는 응용 프로그램 인식 추론을 RAG 파이프라인에 명시적으로 통합하는 원칙적이고 모듈식 확장인 RAG+를 제안합니다. RAG+는 수동 또는 자동으로 생성된 지식과 정렬된 응용 프로그램 예제로 구성된 이중 코퍼스를 구축하고 추론 중에 두 가지를 모두 검색합니다. 이 설계를 통해 LLM은 관련 정보에 액세스할 뿐만 아니라 구조화되고 목표 지향적인 추론 프로세스 내에서 적용할 수 있습니다. 여러 모델에서 수행된 수학, 법률 및 의료 분야에 대한 실험은 RAG+가 표준 RAG 변형보다 일관되게 성능이 우수하며 평균 3-5% 향상되고 복잡한 시나리오에서는 최대 7.5%까지 성능이 향상됨을 보여줍니다. RAG+는 검색과 실행 가능한 응용 프로그램을 연결하여 지식 통합에 대한 더욱 인지적으로 기반을 둔 프레임워크를 발전시키며, 더욱 해석 가능하고 능력 있는 LLM을 향한 진전을 나타냅니다.
시사점, 한계점
•
시사점:
◦
RAG 파이프라인에 응용 프로그램 인식 추론을 명시적으로 통합하여 기존 RAG의 한계를 극복.
◦
수학, 법률, 의료 등 다양한 분야에서 표준 RAG 대비 3-5%의 성능 향상, 최대 7.5% 향상 달성.
◦
더욱 해석 가능하고 능력 있는 LLM 개발을 위한 새로운 프레임워크 제시.
◦
지식 검색과 적용 과정을 더욱 효율적으로 통합하는 방법을 제시.
•
한계점:
◦
이중 코퍼스 생성을 위한 수동 또는 자동화 과정의 효율성 및 정확도에 대한 추가적인 연구 필요.
◦
다양한 응용 분야와 LLM 모델에 대한 일반화 가능성에 대한 추가적인 검증 필요.
◦
RAG+의 성능 향상이 모든 작업과 데이터셋에서 일관되게 나타나는지에 대한 추가 연구 필요.