Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Modelos de difusión de texto a nivel con varios codificadores de texto para Super Mario Bros.

Created by
  • Haebom

Autor

Jacob Schrum, Olivia Kilday, Emilio Salas, Bess Hagan, Reid Williams

Describir

Este artículo presenta un método para generar niveles de juego basados ​​en mosaicos mediante modelos de difusión. Asignamos automáticamente subtítulos a conjuntos de datos existentes de niveles de juego basados ​​en mosaicos y entrenamos el modelo de difusión utilizando un codificador de texto preentrenado y un modelo Transformer simple, de nuestro propio entrenamiento. También asignamos automáticamente subtítulos a los niveles generados, comparamos la correspondencia entre los subtítulos de entrada y salida, y evaluamos la diversidad y la jugabilidad de los niveles. Comparamos y analizamos los resultados con modelos de difusión incondicionales, GAN y técnicas de generación de niveles de texto existentes, como el Modelo de los Cinco Dólares y MarioGPT. En particular, demostramos que el modelo de difusión que utiliza un modelo Transformer simple supera a los modelos que utilizan codificadores de texto complejos con un tiempo de entrenamiento más corto, lo que sugiere que la dependencia de un modelo de lenguaje extenso no es esencial. También proporcionamos una interfaz gráfica de usuario que permite a los diseñadores construir niveles extensos utilizando escenas generadas por el modelo.

Takeaways, Limitations

Takeaways:
Demostración de la utilidad de los modelos de difusión en la generación de niveles de juegos basados ​​en texto.
Presentamos la posibilidad de entrenar modelos generativos efectivos a nivel de texto sin la necesidad de modelos de lenguaje a gran escala.
Se presenta un método de entrenamiento eficiente utilizando un modelo Transformer simple.
Evaluar la diversidad y jugabilidad de los niveles generados y buscar formas de mejorarlos.
Mayor comodidad para el usuario al proporcionar una GUI para el diseño de niveles.
Limitations:
Falta de descripción detallada de los conjuntos de datos y métricas de evaluación utilizadas.
No existen criterios objetivos claros para evaluar la jugabilidad de los niveles generados.
Falta de descripción específica de las características y capacidades de la GUI.
Es necesario un análisis comparativo más profundo con otras técnicas de generación a nivel de texto.
👍