Este artículo presenta un marco de iteración automatizado para el diseño de juegos que se centra en comprender cómo las reglas estáticas y el contenido de un juego se transforman en comportamiento dinámico del jugador. Funciona mediante un agente de aprendizaje por refuerzo (RL) que prueba el juego y un modelo multimodal grande (LMM) lo modifica en función de su comportamiento. El agente RL completa múltiples episodios, generando métricas numéricas de juego o tiras de imágenes que resumen fotogramas de vídeo recientes. El LMM recibe un objetivo de juego y la configuración actual del juego, analiza las trazas de juego y modifica la configuración para guiar las acciones futuras hacia el objetivo. Los resultados experimentales muestran que el LMM puede mejorar iterativamente la mecánica del juego utilizando las trazas de acción proporcionadas por el agente RL, lo que representa una herramienta práctica y escalable para el diseño de juegos asistido por IA.