TalkPlayData 2는 에이전트 기반 데이터 파이프라인을 통해 생성된 멀티모달 대화형 음악 추천을 위한 합성 데이터 세트이다. 이 파이프라인은 다양한 역할과 전문화된 프롬프트를 가진 여러 대규모 언어 모델(LLM) 에이전트를 생성하고, Listener LLM과 Recsys LLM 간의 대화를 기록하여 채팅 데이터를 획득한다. 다양한 대화 시나리오를 다루기 위해, 각 대화에서 Listener LLM은 미세 조정된 대화 목표에 따라 조건화된다. 모든 LLM은 오디오 및 이미지를 포함하는 멀티모달이며, 멀티모달 추천 및 대화 시뮬레이션이 가능하다. LLM-as-a-judge 및 주관적 평가 실험에서 TalkPlayData 2는 음악 생성 추천 모델 훈련과 관련된 다양한 측면에서 목표를 달성했다.