본 논문은 2017년부터 2025년까지 발표된 23개의 실증 연구를 PRISMA 지침에 따라 체계적으로 검토하여 대화형 추천 시스템(CRSs)의 사용자 경험(UX) 평가에 대한 기존 연구의 한계를 분석하고, 향후 연구 방향을 제시합니다. 특히 적응형 CRS와 대규모 언어 모델(LLM) 기반 CRS의 UX 평가에 대한 연구가 부족함을 지적하며, UX 개념 정의, 측정 방법, 도메인, 적응성, LLM의 영향 등을 분석합니다. 후속 조사의 지배, 턴 단위 정서적 UX 구성 요소의 희귀한 평가, 적응적 행동과 UX 결과 간의 희귀한 연결 등의 한계점을 밝히고, LLM 기반 CRS의 인식론적 불투명성과 장황함과 같은 문제점을 지적하며, 더 투명하고 매력적이며 사용자 중심적인 CRS 평가 관행 개발을 위한 구조화된 UX 지표 합성, 적응형 및 비적응형 시스템의 비교 분석, LLM을 고려한 UX 평가를 위한 미래 지향적 의제를 제시합니다.