Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Validación de ítems psicométricos utilizando encuestados virtuales con mediadores de rasgo-respuesta

Created by
  • Haebom

Autor

Sungjib Lim, Woojung Song, Eun-Ju Lee, Yohan Jo

Desarrollo de escala para LLM: un marco de simulación de encuestados virtuales

Describir

Este artículo destaca la necesidad de generar cuestionarios escalables adecuados para los modelos de lenguaje a gran escala (MLG), a medida que aumentan las encuestas psicométricas diseñadas para evaluar las características de los modelos de lenguaje a gran escala (MLG). En particular, es crucial garantizar la validez de constructo, que verifica que los ítems generados realmente midan las características deseadas. Si bien tradicionalmente se ha requerido la recopilación de datos humanos a gran escala y de alto costo, este estudio presenta un marco para simular encuestados virtuales mediante LLM. Este marco considera parámetros para explicar los factores que causan respuestas diversas a ítems de la encuesta con características idénticas. Al simular encuestados con diferentes parámetros, se identifican ítems del cuestionario que miden eficazmente las características deseadas. Los resultados experimentales sobre tres teorías de rasgos psicológicos (Big5, Schwartz y VIA) demuestran que el método de generación de parámetros y el marco de simulación propuestos identifican eficazmente ítems con alta validez. Los LLM demuestran la capacidad de generar parámetros plausibles a partir de definiciones de características y simular el comportamiento del encuestado para verificar la validez de los ítems. La formulación del problema, las métricas, la metodología y el conjunto de datos de este estudio sugieren nuevas direcciones para el desarrollo rentable de cuestionarios y una comprensión más profunda de la simulación de respuestas humanas en encuestas en LLM.

Takeaways, Limitations

Takeaways:
Las simulaciones de encuestados virtuales basadas en LLM sugieren el potencial para el desarrollo de cuestionarios rentables.
Garantizar la validez del constructo de los ítems del cuestionario mediante el uso de conceptos de parámetros
Prueba de aplicabilidad a varias teorías de rasgos psicológicos, incluidas Big5, Schwartz y VIA.
Proporciona nuevos conocimientos sobre las capacidades de simulación de respuestas de encuestas del LLM.
Apoyar la investigación de seguimiento haciendo públicos los conjuntos de datos y el código utilizado en el estudio.
Limitations:
Se necesitan más investigaciones para determinar la precisión de las simulaciones de encuestados virtuales y sus diferencias con las respuestas humanas reales.
Este experimento se limitó a una teoría psicológica específica y se necesita una verificación adicional para generalizarlo a otras teorías y campos.
Los resultados pueden variar según el rendimiento del LLM y los datos de entrenamiento.
Subjetividad y sesgo potencial en la selección de parámetros y la configuración de la simulación
👍