TalkPlayData 2 es un conjunto de datos sintéticos para la recomendación musical conversacional multimodal, generado mediante una canalización de datos basada en agentes. Esta canalización genera múltiples agentes de modelos de lenguaje a gran escala (LLM) con diversos roles e indicaciones especializadas, y registra las conversaciones entre el LLM de Listener y el LLM de Recsys para obtener datos de chat. Para abordar diversos escenarios conversacionales, el LLM de Listener en cada conversación se condiciona a objetivos conversacionales precisos. Todos los LLM son multimodales, incluyendo audio e imágenes, lo que permite la recomendación multimodal y la simulación de conversaciones. En experimentos de evaluación subjetiva y con el LLM como juez, TalkPlayData 2 logró sus objetivos en diversos aspectos relevantes para el entrenamiento de un modelo de recomendación musical.