Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Hacia un fútbol cooperativo y competitivo en el mundo real con equipos de robots cuadrúpedos

Created by
  • Haebom

Autor

Zhi Su, Yuman Gao, Emily Lukas, Yunfei Li, Jiaze Cai, Faris Tulbah, Fei Gao, Chao Yu, Zhongyu Li, Yi Wu, Koushil Sreenath

Describir

Este artículo presenta un marco jerárquico de aprendizaje por refuerzo multiagente (MARL) para lograr el trabajo en equipo cooperativo entre robots con patas. Utilizando el fútbol robótico como entorno de prueba, implementamos interacciones multiagente dinámicas y competitivas. A nivel básico, aprendemos diversas habilidades de movimiento, como caminar, regatear y patear. A nivel avanzado, aprendemos políticas de planificación estratégica mediante Optimización de Políticas Proximales Multiagente (MAPPO) con Juego Autoficticio Ficticio (FSP). Esto permite a los agentes adaptarse a diversas estrategias del oponente y demostrar comportamientos de equipo sofisticados, como pases cooperativos, intercepciones y reparto de roles. Aplicamos este marco a robots cuadrúpedos reales para realizar partidos de fútbol autónomos robot-robot y robot-humano, tanto en interiores como en exteriores, utilizando únicamente su propia conciencia posicional.

Takeaways, Limitations

Takeaways:
Se presenta un marco MARL eficaz para el trabajo en equipo colaborativo de robots con patas.
Lograr un alto rendimiento mediante la integración jerárquica de tecnologías operativas de bajo nivel y planificación estratégica de alto nivel.
Adaptabilidad a diversas estrategias rivales e implementación de comportamientos de equipo sofisticados (pase, intercepción, división de roles).
Verificación del rendimiento en entornos reales mediante experimentos utilizando plataformas robóticas reales.
Limitations:
El artículo carece de descripciones detalladas de configuraciones ambientales específicas (por ejemplo, especificaciones del robot, tamaño de la arena, etc.).
Falta de análisis del costo computacional y velocidad de convergencia del proceso de aprendizaje utilizando FSP.
Falta de evaluación de la robustez del robot ante diversos factores externos (por ejemplo, terreno irregular, comportamiento impredecible del oponente).
Falta de consideración por la vida útil de la batería del robot y problemas de durabilidad durante partidos de larga duración.
👍