Ext2Gen: Alignment through Unified Extraction and Generation for Robust Retrieval-Augmented Generation
Created by
Haebom
Category
Empty
저자
Hwanjun Song, Jeonghwan Choi, Minseok Kim
개요
Retrieval-augmented generation (RAG)은 외부 지식을 통합하여 대규모 언어 모델(LLM)을 향상시키지만, 관련 청크의 불확실한 배치와 검색으로 인한 정보 과부하로 인해 생성이 여전히 취약하고 환각이 발생할 수 있습니다. 본 논문에서는 먼저 질의와 관련된 문장을 추출한 후 답변을 생성하는 새로운 추출-생성 모델인 Ext2Gen을 제안합니다. 이 모델을 최적화하기 위해 쌍방향 피드백 학습을 통한 선호도 정렬을 사용하여 검색 결과의 변화에 관계없이 강력한 답변을 생성할 수 있도록 합니다. 광범위한 실험을 통해 Ext2Gen이 높은 정밀도와 재현율로 질의와 관련된 문장을 효과적으로 식별하여 매우 신뢰할 수 있는 답변을 생성함을 보여줍니다. 또한, RAG 환경에 본 모델을 배포하면 기본 LLM의 성능을 향상시킬 뿐만 아니라 질의 확장과 같은 고급 검색 전략과 시너지를 발휘합니다. 해당 모델은 https://huggingface.co/DISLab/Ext2Gen-8B-R2 에서 이용 가능합니다.