Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Distilling a Small Utility-Based Passage Selector to Enhance Retrieval-Augmented Generation

Created by
  • Haebom

저자

Hengran Zhang, Keping Bi, Jiafeng Guo, Jiaming Zhang, Shuaiqiang Wang, Dawei Yin, Xueqi Cheng

Retrieval-augmented Generation (RAG)에서 유틸리티 기반 선택을 위한 효율적인 모델 증류

개요

본 논문은 검색 증강 생성(RAG)에서 유틸리티 기반 검색의 효율성을 높이기 위해, 대규모 언어 모델(LLM)의 유틸리티 판단 능력을 소형 모델로 증류하는 방법을 제안합니다. 특히, 복잡한 질문에 대한 답변 생성을 위해 유틸리티 기반 선택 접근 방식을 적용하며, 고정 임계값이 아닌 동적 문단 선택을 가능하게 합니다. 교사 LLM(Qwen3-32B)으로부터 가짜 답변 생성과 유틸리티 판단을 학습한 학생 모델(RankQwen1.7B, UtilityQwen1.7B)을 훈련하여 계산 비용을 줄이면서 답변 품질을 향상시켰습니다. MS MARCO 데이터셋에 대한 관련성 랭킹 및 유틸리티 기반 선택 주석을 공개하여 해당 분야의 연구를 지원할 예정입니다.

시사점, 한계점

시사점:
유틸리티 기반 선택은 복잡한 질문에 대한 답변 생성 성능을 향상시키는 데 효과적입니다.
LLM의 유틸리티 판단 능력을 소형 모델로 증류하여 계산 비용을 절감할 수 있습니다.
동적 문단 선택을 통해 특정 질문에 맞게 유연하게 문단을 선택할 수 있습니다.
MS MARCO 데이터셋에 대한 주석 공개는 추가 연구를 촉진합니다.
한계점:
현재 한계점은 논문에 명시되어 있지 않습니다.
👍