Preference Discerning with LLM-Enhanced Generative Retrieval
Created by
Haebom
저자
Fabian Paischer, Liu Yang, Linfeng Liu, Shuai Shao, Kaveh Hassani, Jiacheng Li, Ricky Chen, Zhang Gabriel Li, Xiaoli Gao, Wei Shao, Xue Feng, Nima Noorshams, Sem Park, Bo Long, Hamid Eghbalzadeh
개요
연속 추천에서 사용자의 상호 작용 기록을 기반으로 항목을 추천하는 모델에 대한 연구입니다. 기존 모델은 항목 설명, 사용자 의도 또는 선호도와 같은 정보를 통합하지만, 사용자 선호도는 일반적으로 명시적으로 주어지지 않아 대규모 언어 모델(LLM) 등을 통해 추정됩니다. 이러한 접근 방식은 훈련 중에만 추정된 사용자 선호도를 활용하고, 추천을 위해 과거 상호 작용 기록에만 의존하여 변화하는 선호도에 동적으로 적응하는 데 한계가 있습니다. 이러한 문제를 해결하기 위해 본 연구에서는 "선호도 식별"이라는 새로운 패러다임을 제안합니다. 이는 생성적 추천 모델이 자연어 형태의 사용자 선호도를 맥락 내에서 명시적으로 조건화합니다. 또한, 선호도 조작 및 감성 따르기 등 다양한 시나리오를 포괄하는 새로운 벤치마크를 도입하여 선호도 식별을 평가합니다. 최신 방법들을 해당 벤치마크에서 평가한 결과, 기존 방법들이 진화하는 사용자 선호도에 동적으로 적응하는 능력이 제한적임을 확인했습니다. 이를 해결하기 위해, 본 연구에서는 Mender (Multimodal Preference Discerner)라는 새로운 방법을 제안하며, 이는 새로운 벤치마크에서 최고 성능을 달성합니다. Mender는 훈련 중에 관찰되지 않은 경우에도 인간의 선호도에 따라 추천을 효과적으로 조정하여 더욱 유연한 추천 모델을 제시합니다.