Hace poco, ByteDance presentó DiffusionGPT, que como el nombre lo indica, es un sistema de generación de texto a imagen basado en modelos de lenguaje. DiffusionGPT construye un “árbol de pensamientos” específico para cada dominio en varios modelos generativos, usando conocimientos previos. Cuando recibe una entrada, el LLM analiza el prompt y utiliza este “árbol de pensamientos” para elegir el modelo adecuado, relajando así las restricciones y asegurando un rendimiento sobresaliente en distintos ámbitos. Además, introduce el concepto de "Advantage Databases" para enriquecer el árbol con feedback humano, alineando el proceso de selección de modelos según las preferencias de las personas.