Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Cuidado con la brecha entre valor y acción: ¿Los LLM actúan en consonancia con sus valores?

Created by
  • Haebom

Autor

Hua Shen, Nicholas Clark, Tanushree Mitra

Describir

Este artículo aborda las limitaciones de la investigación existente para evaluar la alineación de valores de los modelos lingüísticos a gran escala (LLM) y propone ValueActionLens, un novedoso marco de evaluación que considera la brecha valor-acción. A partir de un conjunto de datos de 14.800 acciones basadas en valores en 12 culturas y 11 temas sociales, ValueActionLens evalúa la alineación entre los valores declarados de los LLM y las acciones basadas en valores mediante tres métricas. Los resultados experimentales demuestran que la alineación entre los valores declarados y las acciones de los LLM es subóptima y varía significativamente entre contextos y modelos. Además, identificamos los posibles perjuicios causados ​​por las brechas valor-acción y demostramos la eficacia del uso de explicaciones inferenciales para predecir dichas brechas. En conclusión, destacamos los peligros de basarnos únicamente en los valores declarados para predecir el comportamiento de los LLM y enfatizamos la importancia de una evaluación contextual de los valores de los LLM y las brechas valor-acción.

Takeaways, Limitations

Takeaways:
Esto demuestra las limitaciones de simplemente considerar los valores establecidos al evaluar la alineación de valores de los LLM.
Presentamos ValueActionLens, un nuevo marco de evaluación que tiene en cuenta el fenómeno de la brecha entre valor y acción.
Identificar el daño potencial causado por la brecha valor-acción en LLM y buscar formas de mitigarlo.
Sugerir la posibilidad de mejorar el desempeño de la predicción de brechas entre valores y comportamiento mediante el uso de explicaciones inferenciales.
Enfatizar la importancia de una valoración LLM consciente del contexto.
Limitations:
Se necesita más investigación para explorar la generalización del marco ValueActionLens.
Se necesitan más experimentos con diferentes modelos LLM y en una gama más amplia de situaciones.
Se necesitan más investigaciones para determinar las causas exactas de la brecha entre valores y comportamiento y encontrar soluciones.
Es necesario revisar el conjunto de datos para detectar sesgos culturales y la objetividad de la selección de temas sociales.
👍