Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

MTRec: Learning to Align with User Preferences via Mental Reward Models

Created by
  • Haebom

저자

Mengchen Zhao, Yifan Gao, Yaqing Hou, Xiangyang Li, Pengjie Gu, Zhenhua Dong, Ruiming Tang, Yi Cai

개요

본 논문은 사용자의 실제 선호도를 파악하여 추천 시스템의 성능을 향상시키기 위해, 암묵적 피드백의 한계를 극복하는 새로운 순차적 추천 프레임워크인 MTRec을 제안한다. MTRec은 사용자의 만족도를 정량화하는 정신적 보상 모델을 도입하고, 이를 학습하기 위해 분포 역 강화 학습 기법을 사용한다. 학습된 정신적 보상 모델은 추천 모델이 사용자의 실제 선호도에 더 잘 부합하도록 안내하며, 실험 결과 및 실제 단편 영상 플랫폼에서의 적용을 통해 MTRec의 효과를 입증한다.

시사점, 한계점

시사점:
암묵적 피드백의 문제점을 해결하여 추천 시스템의 성능을 향상시키는 새로운 프레임워크 제시.
사용자의 만족도를 정량화하는 정신적 보상 모델의 도입 및 분포 역 강화 학습 활용.
실제 산업 환경에서의 적용을 통해 실용성을 입증.
다양한 추천 모델에 적용하여 일관된 성능 향상을 보임.
한계점:
정신적 보상 모델의 정확성에 대한 의존성.
모델 학습 및 적용에 필요한 계산 비용.
특정 플랫폼 (단편 영상)에 대한 실험 결과의 일반화 가능성에 대한 추가적인 연구 필요.
👍