본 논문은 기존 추천 시스템의 한계인 기존 아이템 필터링에만 집중하는 점을 극복하고자, 사용자 맞춤형 이미지 등 다양한 형태의 아이템을 직접 생성하는 새로운 패러다임을 제시합니다. 이를 위해 임의의 입력-출력을 처리할 수 있는 대규모 다중 모달 모델(LMMs)을 활용하여, 지도 학습 기반 미세 조정과 온라인 강화 학습 전략을 통해 사용자에게 적합한 다음 아이템을 생성하는 능력을 갖추도록 모델을 학습시킵니다. 두 개의 벤치마크 데이터셋과 사용자 연구를 통해 제안된 방법의 효과를 확인하였으며, 생성된 이미지는 사용자의 과거 선호도와 미래 관심사 모두와 잘 부합함을 보였습니다.