대규모 언어 모델(LLM)의 추론 능력을 활용하여 콜드 스타트 환경에서 추천 시스템 성능을 향상시키는 새로운 방법을 제안합니다. 특히, 넷플릭스 도메인에서 희소한 상호작용 데이터를 가진 새로운 아이템에 대한 사용자 선호도를 효과적으로 추론합니다. 지도 학습 기반 미세 조정, 강화 학습 기반 미세 조정, 그리고 두 방법을 결합한 하이브리드 접근 방식을 평가합니다. 실제 데이터를 사용한 실험 결과는 콜드 스타트 추천 환경에서 방법론적 효과와 실용적 성능 모두에서 상당한 개선을 보였으며, 일부 경우 넷플릭스의 기존 랭킹 모델보다 최대 8% 더 높은 성능을 달성했습니다.