Cet article passe en revue systématiquement 23 études empiriques publiées entre 2017 et 2025 selon les recommandations PRISMA afin d'analyser les limites des recherches existantes sur l'évaluation de l'expérience utilisateur (UX) des systèmes de recommandation conversationnelle (SRC) et de suggérer des pistes de recherche futures. Plus précisément, nous soulignons la rareté des recherches sur l'évaluation UX des SRC adaptatifs et des modèles linguistiques à grande échelle (MLH). Nous analysons les définitions des concepts UX, les méthodes de mesure, les domaines, l'adaptabilité et l'influence des LHH. Nous mettons en évidence Limitations, notamment la prédominance des recherches complémentaires, la rareté de l'évaluation des composantes émotionnelles UX au tour par tour et le lien rare entre comportements adaptatifs et résultats UX. Nous soulignons également les problèmes des SRC basés sur les LHH, tels que l'opacité épistémologique et la verbosité de ces systèmes. Nous proposons une synthèse structurée des métriques UX pour développer des pratiques d'évaluation CRS plus transparentes, engageantes et centrées sur l'utilisateur, une analyse comparative des systèmes adaptatifs et non adaptatifs et un programme d'évaluation UX orienté vers l'avenir qui prend en compte les LLM.