[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Volar, fallar, arreglar: Reparación iterativa de juegos con aprendizaje de refuerzo y grandes modelos multimodales

Created by
  • Haebom

Autor

Alex Zook, Josef Spjut, Jonathan Tremblay

Describir

Este artículo presenta un marco de iteración automatizado para el diseño de juegos que se centra en comprender cómo las reglas estáticas y el contenido de un juego se transforman en comportamiento dinámico del jugador. Funciona mediante un agente de aprendizaje por refuerzo (RL) que prueba el juego y un modelo multimodal grande (LMM) lo modifica en función de su comportamiento. El agente RL completa múltiples episodios, generando métricas numéricas de juego o tiras de imágenes que resumen fotogramas de vídeo recientes. El LMM recibe un objetivo de juego y la configuración actual del juego, analiza las trazas de juego y modifica la configuración para guiar las acciones futuras hacia el objetivo. Los resultados experimentales muestran que el LMM puede mejorar iterativamente la mecánica del juego utilizando las trazas de acción proporcionadas por el agente RL, lo que representa una herramienta práctica y escalable para el diseño de juegos asistido por IA.

Takeaways, Limitations

Takeaways:
Combinando el aprendizaje de refuerzo y modelos multimodales a gran escala para demostrar el potencial de automatizar y mejorar la eficiencia del diseño de juegos.
Proporcionar instrucciones prácticas para desarrollar herramientas de diseño de juegos basadas en IA.
Presenta un método para analizar eficazmente los datos de comportamiento de los jugadores y reflejarlos en el diseño del juego.
Limitations:
Se necesita más investigación sobre el rendimiento y la capacidad de generalización del LMM.
Es necesario verificar la aplicabilidad a varios géneros y complejidades de juegos.
Necesidad de mejorar la eficiencia de la interacción y la transferencia de información entre los agentes RL y los LMM.
Se necesita más investigación sobre la escalabilidad del marco presentado actualmente y su aplicabilidad en entornos de desarrollo de juegos reales.
👍