Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Cuantificación de la equidad en los LLM más allá de los tokens: una perspectiva semántica y estadística

Created by
  • Haebom

Autor

Weijie Xu, Yiwen Wang, Chi Xue, Xiangkun Hu, Xi Fang, Guimin Dong, Chandan K. Reddy

Describir

Los modelos lingüísticos a gran escala (LLM) suelen generar respuestas con sesgos inherentes, lo que compromete su fiabilidad en aplicaciones prácticas. Los métodos de evaluación existentes suelen pasar por alto los sesgos inherentes a las respuestas extensas y la variabilidad inherente a los resultados de los LLM. Para abordar estos desafíos, este artículo propone la Comparación Semántica de Grano Fino (FiSCo), un novedoso marco estadístico para evaluar la imparcialidad a nivel de grupo en los LLM mediante la detección de diferencias semánticas sutiles en las respuestas extensas entre grupos demográficos. A diferencia de estudios previos que se centran en comparaciones a nivel de sentimiento o de token, FiSCo analiza las respuestas a nivel semántico mediante comprobaciones de implicación para evaluar la consistencia semántica. Descompone los resultados del modelo en afirmaciones semánticamente distintas y aplica pruebas de hipótesis estadísticas para comparar similitudes entre grupos y dentro de ellos, lo que permite una detección robusta de sesgos sutiles. Formalizamos una novedosa definición de imparcialidad contrafactual de grupo y validamos FiSCo en conjuntos de datos sintéticos y anotados por personas que incluyen género, raza y edad. Los resultados experimentales demuestran que FiSCo supera varias métricas de evaluación al identificar sesgos sutiles de manera más confiable y al mismo tiempo mitigar el impacto de la variabilidad estocástica de LLM.

Takeaways, Limitations

Takeaways:
Proponer un nuevo marco estadístico, FiSCo, para evaluar la equidad a nivel de grupo en los LLM.
Resolver los problemas de sesgo en respuestas largas y variabilidad en la salida LLM, que son limitaciones de los métodos existentes.
Detecta sesgos sutiles y permite una evaluación sólida a través del análisis de nivel semántico.
Una nueva definición de equidad contrafactual grupal
Realizar una validación experimental en diversos grupos demográficos, incluidos género, raza y edad.
Se confirmó un rendimiento superior en comparación con los indicadores de evaluación existentes
Limitations:
El rendimiento de FiSCo puede depender del conjunto de datos utilizado y de la calidad de las anotaciones.
Es posible que no todos los tipos de sesgo puedan detectarse perfectamente.
Los costos computacionales pueden ser altos.
Se necesitan más investigaciones sobre la generalización de la nueva definición de justicia contrafactual grupal.
👍