Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Cuidado con la brecha: la divergencia entre las tareas humanas y las generadas por LLM

작성자
  • Haebom

Autor

Yi-Long Lu, Jiajun Song, Chunhui Zhang, Wei Wang

Describir

Este artículo realizó experimentos de generación de tareas con humanos y GPT-4o para investigar si los agentes generativos basados en modelos de lenguaje a gran escala (LLM) generan tareas de forma similar a la humana. Nuestros resultados muestran que, si bien la generación de tareas humanas se ve constantemente influenciada por valores personales como la apertura a la experiencia y motivadores psicológicos como el estilo cognitivo, los LLM no reflejan estos patrones de comportamiento, incluso cuando se les proporcionan explícitamente motivadores psicológicos. Las tareas generadas por LLM fueron menos sociales, menos exigentes físicamente y más centradas en temas abstractos. Si bien las tareas generadas por LLM se calificaron como más atractivas y novedosas, esto demuestra una brecha entre las habilidades lingüísticas de los LLM y su capacidad para generar objetivos concretos y similares a los humanos. En conclusión, existe una diferencia fundamental entre la naturaleza concreta e impulsada por valores de la cognición humana y los patrones estadísticos de los LLM. Diseñar agentes más centrados en el ser humano requiere integrar la motivación intrínseca y los fundamentos físicos.

Takeaways, Limitations

Takeaways:
Hemos descubierto que la creación de trabajo humano está significativamente influenciada por los valores personales y los estilos cognitivos.
A diferencia de los humanos, los LLM no son sociales, tienen menos actividad física y tienden a producir tareas abstractas.
Existe una brecha entre las habilidades lingüísticas de un LLM y las habilidades humanas para generar objetivos.
La integración de la motivación intrínseca y los fundamentos físicos es esencial para desarrollar agentes centrados en el ser humano.
Limitations:
Los experimentos GPT-4o se realizaron utilizando un solo LLM, lo que limita la generalización.
Es posible que el desempeño del LLM no haya sido evaluado adecuadamente debido a limitaciones en la forma en que se proporcionaron las motivaciones psicológicas al LLM.
Es necesario realizar una revisión más profunda de la confiabilidad de los resultados debido a la información insuficiente sobre el número y la diversidad de los participantes en el estudio.
👍