每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

TalkPlayData 2:用于多模式对话音乐推荐的代理合成数据管道

Created by
  • Haebom

作者

崔根佑、都升宪、南柱汉

TalkPlayData 2:多模式对话式音乐推荐

大纲

本文介绍了 TalkPlayData 2,这是一个用于多模态对话音乐推荐的合成数据集,通过基于代理的数据流水线生成。在该流水线中,生成了多个具有不同角色的大规模语言模型 (LLM) 代理,每个代理都可以访问专门的提示和信息。对话数据是通过记录 Listener LLM 和 Recsys LLM 之间的对话获得的。为了应对不同的对话场景,Listener LLM 会根据每个对话的微调对话目标进行调整。最终,所有 LLM 都是多模态的,包含音频和图像,从而支持多模态推荐和对话模拟。在 LLM 评判实验和主观评价实验中,TalkPlayData 2 在与训练音乐生成推荐模型相关的各个方面都实现了所提出的目标。TalkPlayData 2 及其生成代码已在https://talkpl.ai/talkplaydata2.html에서下开源。

Takeaways,Limitations

使用基于代理的管道生成多模式对话音乐推荐数据集。
使用精细调整的对话目标来涵盖各种对话场景。
通过法学硕士评委和主观评估来验证目标的实现情况
提供开源数据集和生成代码
摘要中未指定具体的 Limitations。
👍