Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

IPCGRL: Aprendizaje por refuerzo instruido por el lenguaje para la generación de niveles procedimentales

Created by
  • Haebom

Autor

In Chang Baek, Sung Hyun Kim, Seo Young Lee, Dong Hyeon Kim, Kyung Joong Kim

Describir

En este artículo, proponemos IPCGRL, un método de generación de contenido procedural basado en instrucciones y aprendizaje por refuerzo. IPCGRL comprime eficazmente las condiciones a nivel de juego mediante la integración de modelos de incrustación de oraciones y optimiza la representación de la incrustación para tareas específicas. En comparación con los métodos de incrustación convencionales en tareas de generación a nivel bidimensional, demostramos que IPCGRL mejora la controlabilidad hasta en un 21,4 % y el rendimiento de generalización para instrucciones desconocidas en un 17,2 %. Esto permite un marco de interacción de generación de contenido procedural más flexible y expresivo al ampliar la modalidad de entradas condicionales.

Takeaways, Limitations

Takeaways:
Presentamos un enfoque novedoso para la generación de contenido procedimental basado en comandos.
Comprima eficazmente las condiciones a nivel de juego aprovechando modelos de incrustación de oraciones.
Se mejora la controlabilidad y el rendimiento de generalización en comparación con los métodos existentes.
Amplía la modalidad de entrada condicional para proporcionar un marco de interacción más flexible y expresivo.
Limitations:
Dado que la evaluación se realizó solo en una tarea de generación de nivel bidimensional, la generalización a otros tipos de tareas de generación de contenido requiere más investigación.
El rendimiento de IPCGRL puede verse afectado por el rendimiento del modelo de incrustación de oraciones utilizado.
Se requiere aplicación y evaluación del rendimiento en entornos de juego reales.
👍