Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Evaluating User Experience in Conversational Recommender Systems: A Systematic Review Across Classical and LLM-Powered Approaches

Created by
  • Haebom

作者

Raj Mahmud, Yufeng Wu, Abdullah Bin Sawad, Shlomo Berkovsky, Mukesh Prasad, A. Baki Kocaballi

概要

本論文は、2017年から2025年までに発表された23の実証研究をPRISMA指針に従って体系的に検討し、対話型推薦システム(CRSs)のユーザー体験(UX)評価に対する既存研究の限界を分析し、今後の研究方向を提示します。特に、適応型CRSと大規模言語モデル(LLM)ベースのCRSのUX評価に関する研究が不足していることを指摘し、UX概念の定義、測定方法、ドメイン、適応性、LLMの影響などを分析します。フォローアップ調査の支配、ターン単位の感情的なUXコンポーネントの希少な評価、適応的行動とUXの結果間の希少な接続などのLimitationsを明らかにし、LLMベースのCRSの認識論的不透明性と冗長性などの問題を指摘し、より透明で魅力的でユーザー指向のCRS評価慣行の開発システムの比較分析、LLMを考慮したUX評価のための将来指向の議題を提示します。

Takeaways、Limitations

Takeaways:
対話型推奨システム(CRS)のユーザーエクスペリエンス(UX)評価の体系的な分析を提供します。
適応型CRSとLLMベースのCRSのUX評価のLimitationsを明確に明らかにする。
より透明でユーザー中心のCRS評価慣行開発のための構造化されたUX指標と将来指向のアジェンダを提示します。
LLMベースのCRSの特殊なUX問題(認識的不透明性、冗長性)を強調します。
Limitations:
その後の調査に依存するUX評価方式の制限を指摘します。
ターン単位の感情的なUXコンポーネントの評価が不足しています。
適応行動とUX結果との間の関連性分析は不十分である。
LLM ベースの CRS の UX 評価では、認識論的不透明性と冗長性の検討が不足している。
👍