Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

GroupRank: A Groupwise Reranking Paradigm Driven by Reinforcement Learning

Created by
  • Haebom
Category
Empty

저자

Duolin Sun, Meixiu Long, Dan Yang, Yihan Jiao, Zhehao Tan, Jie Feng, Junjie Wang, Yue Shen, Peng Wei, Jian Wang, Jinjie Gu

개요

본 논문은 RAG 시스템의 성능을 향상시키기 위한 리랭커(reranker)로서 대규모 언어 모델(LLM)의 잠재력을 탐구합니다. 기존 리랭킹 방법론의 한계를 극복하기 위해, 본 연구는 Pointwise 방식의 유연성과 Listwise 방식의 비교 능력을 결합한 Groupwise라는 새로운 리랭킹 패러다임을 제안합니다. 제안된 방법론은 후보 문서 그룹을 LLM에 함께 입력하여 각 문서에 대한 관련성 점수를 할당하며, 랭킹 지표와 점수 분포 정렬을 결합한 이종 보상 함수를 사용합니다. 또한, 고품질 라벨 데이터 부족 문제를 해결하기 위해 검색 및 랭킹 데이터를 합성하는 파이프라인을 제시합니다.

시사점, 한계점

시사점:
Pointwise 방식의 유연성과 Listwise 방식의 비교 능력을 결합한 Groupwise 리랭킹 패러다임 제안.
랭킹 지표와 점수 분포 정렬을 통합한 이종 보상 함수(GRPO) 활용.
고품질 검색 및 랭킹 데이터 합성을 위한 혁신적인 파이프라인 개발.
BRIGHT 및 R2MED 벤치마크에서 기존 방법론 대비 우수한 성능 입증.
한계점:
논문에 구체적인 한계점에 대한 언급은 없음.
👍