Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Las probabilidades de los LLM de Chat están mal calibradas, pero aún así predicen la exactitud en preguntas y respuestas de opción múltiple

Created by
  • Haebom

Autor

Benjamín Plaut, Nguyen X. Khanh, Tu Trinh

Describir

Este artículo analiza 15 modelos de lenguaje a gran escala (LLM) y descubre que la probabilidad softmax máxima (MSP) de los LLM ajustados para chat se descalibra sistemáticamente en preguntas y respuestas de opción múltiple. Sin embargo, los MSP aún pueden contener información útil sobre la incertidumbre. Planteamos la hipótesis de que las respuestas incorrectas se asociarán con MSP menores que las respuestas correctas, y rigurosas pruebas estadísticas demuestran que esta hipótesis es válida para los modelos que funcionan bien en la tarea básica de preguntas y respuestas. También encontramos una fuerte correlación direccional entre la precisión de las preguntas y respuestas y las predicciones de precisión de los MSP, pero ninguna correlación entre la precisión de las preguntas y respuestas y los errores de calibración. Esto sugiere que, dentro del paradigma actual de ajuste fino, mejorar el rendimiento de los LLM probablemente resultará en mejores predicciones de precisión, no en calibración. También presentamos resultados experimentales que demuestran que rechazar selectivamente las respuestas basadas en MSP puede mejorar el rendimiento.

Takeaways, Limitations

Takeaways:
Demostramos que incluso si el MSP del LLM está mal calibrado en preguntas y respuestas de opción múltiple, todavía puede proporcionar información útil para predecir respuestas correctas/incorrectas.
A medida que mejora el rendimiento de LLM, es probable que mejore el rendimiento de predicción de respuestas correctas, pero es poco probable que mejore el rendimiento de corrección.
El MSP puede utilizarse para mejorar el rendimiento mediante una estrategia de rechazo. Incluso con una pequeña cantidad de datos de etiquetas, el rendimiento puede mejorarse estableciendo umbrales de MSP.
Limitations:
El análisis se limita a un tipo específico de tarea de preguntas y respuestas.
Se necesitan más investigaciones para determinar la generalización de las estrategias de rechazo de respuesta basadas en MSP.
Se necesita más investigación sobre diversas arquitecturas LLM y métodos de ajuste.
👍