Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

PersonaGym: Evaluación de agentes Persona y LLM

Created by
  • Haebom

Autor

Vinay Samuel, Henry Peng Zou, Yue Zhou, Shreyas Chaudhari, Ashwin Kalyan, Tanmay Rajpurohit, Ameet Deshpande, Karthik Narasimhan, Vishvak Murahari

Describir

Este artículo presenta PersonaGym, un marco de evaluación dinámica, y PersonaScore, una métrica de evaluación automática basada en la teoría de la decisión. Aborda el problema de evaluar el grado de adhesión a la personalidad de un agente persona (un agente LLM condicionado a actuar según una personalidad específica) en un entorno libre donde se debe mantener la coherencia en diversos entornos. La evaluación de diez LLM líderes con 200 personas y 10 000 preguntas revela que el tamaño y la complejidad del modelo no se correlacionan necesariamente con el rendimiento del agente persona, lo que pone de relieve la necesidad de innovaciones algorítmicas y arquitectónicas para lograr agentes persona fieles y de alto rendimiento. Por ejemplo, GPT-4.1 y LLaMA-3-8b obtuvieron puntuaciones PersonaScore idénticas.

Takeaways, Limitations

Takeaways:
PersonaGym y PersonaScore proporcionan nuevos marcos y métricas para evaluar de forma integral el desempeño de los agentes de persona.
Demostramos que el tamaño y la complejidad de los modelos de lenguaje a gran escala no garantizan el desempeño de los agentes personales, lo que sugiere futuras direcciones de investigación.
Sugiere el potencial para el desarrollo de agentes personales en diversos campos como la educación y la salud.
Limitations:
Es posible que se necesite una validación adicional del método de alineación humana de PersonaScore.
El tipo y alcance de los LLM utilizados en la evaluación pueden ser limitados.
Tal vez se necesiten más investigaciones para abordar por completo las complejidades de la evaluación de la consistencia de la personalidad en entornos de forma libre.
👍