Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Corrompidos por el razonamiento: los modelos de lenguaje de razonamiento se convierten en oportunistas en los juegos de bienes públicos

Created by
  • Haebom

Autor

David Guzmán Piedrahita, Yongjin Yang, Mrinmaya Sachan, Giorgia Ramponi, Bernhard Scholkopf, Zhijing Jin

Describir

Este artículo estudia el rol de las sanciones costosas en la interacción de múltiples agentes de modelos de lenguaje a gran escala (LLM). Aplicando el juego de bienes públicos de la economía del comportamiento al sistema de agentes LLM, observamos cómo los LLM abordan dilemas sociales en interacciones repetidas. Nuestro análisis revela que los LLM exhiben cuatro patrones de comportamiento: grupos que mantienen un nivel constante de cooperación, grupos que alternan entre cooperación y no cooperación, grupos cuya cooperación disminuye con el tiempo y grupos que siguen estrategias fijas independientemente del resultado. Sorprendentemente, mientras que los LLM con alta capacidad de razonamiento, como la serie o1, tienen dificultades para cooperar, algunos LLM existentes logran consistentemente altos niveles de cooperación. Esto sugiere que los enfoques actuales de mejora de los LLM que se centran en mejorar la capacidad de razonamiento podrían no conducir a la cooperación.

Takeaways, Limitations

Takeaways:
Demostramos que la mejora en la capacidad de razonamiento de LLM no conduce directamente a la cooperación, lo que sugiere la necesidad de un nuevo enfoque para diseñar el comportamiento cooperativo de los agentes LLM.
Descubrimiento de diferentes patrones de comportamiento cooperativo en diferentes arquitecturas LLM y métodos de entrenamiento. Destacando los desafíos de predecir y controlar el comportamiento social en LLM.
Presentar el potencial del análisis del comportamiento social del LLM a través de marcos experimentales como los juegos de bienes públicos.
Limitations:
Limitaciones en el tipo y la versión de LLM utilizados en el experimento. Limita la generalización entre diferentes LLM.
Resultados del análisis para una situación específica denominada «juego de bienes públicos». Se requiere mayor investigación para generalizar a otros tipos de dilemas sociales.
Falta de análisis de sensibilidad sobre el diseño específico y los parámetros del mecanismo de sanciones.
👍