Learning to Select In-Context Demonstration Preferred by Large Language Model
Created by
Haebom
저자
Zheng Zhang, Shaocheng Lan, Lei Song, Jiang Bian, Yexin Li, Kan Ren
개요
본 논문은 대규모 언어 모델(LLM)의 컨텍스트 내 학습(ICL) 성능 향상을 위한 새로운 프레임워크인 GenICL을 제안합니다. 기존의 검색 기반 ICL 방법들은 대리 목적 함수에 의존하여 실제로 유용한 데모를 찾는 데 어려움을 겪고, 후보군에 질 높은 데모가 부족할 경우 성능이 저하되는 문제점을 가지고 있습니다. GenICL은 LLM의 피드백을 활용하여 데모 선택을 직접 최적화하는 생성적 선호도 학습 프레임워크로, 19개 데이터셋(11개 작업 분류)에 대한 실험 결과 기존 방법보다 우수한 데모 선택 및 ICL 성능을 보여줍니다.