STACKFEED: Structured Textual Actor-Critic Knowledge base editing with FEEDback
개요
본 논문은 대규모 언어 모델(LLM)이 부정확하거나 오래된 정보를 생성하는 문제를 해결하기 위해, 외부 지식 기반(KB)의 정확성을 향상시키는 새로운 접근 방식인 STACKFEED를 제시합니다. STACKFEED는 다중 액터, 중앙 집중형 비평가 강화 학습 프레임워크를 사용하여 전문가 피드백을 기반으로 KB를 반복적으로 개선합니다. 이는 각 문서에 대한 구조적 편집을 수행하는 ReACT 액터 에이전트를 정의합니다. STACKFEED는 저자원 프로그래밍 문제, 수정된 파이썬 패키지 및 사실 기반 질의 응답 작업에서 RAG 시스템의 KB 품질과 성능을 크게 향상시킵니다.