每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

使用 LLM 增强生成检索进行偏好辨别

Created by
  • Haebom

作者

Fabian Paischer、刘洋、刘林峰、邵帅、Kaveh Hassani、李家成、Ricky Chen、张加布里埃尔、高晓丽、邵伟、薛峰、Nima Noorshams、Sem Park、Bo Long、Hamid Eghbalzadeh

大纲

本研究探讨了基于用户交互历史的持续推荐模型。现有模型会整合商品描述、用户意图或偏好等信息,但用户偏好通常并非明确给出,因此需要使用大规模语言模型 (LLM) 等工具进行估算。这些方法仅利用训练期间估计的用户偏好,并仅依赖过去的交互历史进行推荐,这限制了它们动态适应不断变化的偏好的能力。为了解决这个问题,本研究提出了一种名为“偏好辨别”的新范式,其中生成式推荐模型在特定语境下,以自然语言明确地限定用户偏好。此外,我们使用一个涵盖多种场景(包括偏好操纵和情绪跟随)的新基准来评估偏好辨别能力。通过在该基准上评估最先进的方法,我们发现现有方法在动态适应不断变化的用户偏好方面存在局限性。为了解决这个问题,我们提出了一种名为 Mender(多模态偏好辨别器)的新方法,该方法在新的基准上取得了最先进的性能。 Mender 提供了一种更灵活的推荐模型,它可以根据人类偏好有效地调整推荐,即使在训练期间没有观察到这些偏好。

Takeaways, Limitations

Takeaways:
提出明确考虑用户偏好的“偏好识别”范式。
引入新的基准,包括偏好操纵和情感追随。
Mender模型的提出及SOTA性能的实现。
这表明有可能开发一种灵活的推荐模型,甚至可以适应未经训练的偏好。
Limitations:
缺乏有关特定 Mender 模型的架构、学习方法和详细性能分析的信息。
需要进一步研究来验证其在现实环境中的适用性和性能。
需要检查所提出的基准的普遍性及其对各种数据集的适用性。
👍