Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

¿Quiénes son los nombres mencionados? Auditoría de las recomendaciones académicas basadas en el Máster en Derecho (LLM)

Created by
  • Haebom

Autor

Daniele Barolo, Chiara Valentin, Fariba Karimi, Luis Gal Arraga, Gonzalo G. Méndez, Lisette Esp in-Noboa

Describir

Este artículo evalúa el desempeño de la recomendación de expertos en física utilizando seis modelos de lenguaje de gran escala y peso abierto (llama3-8b, llama3.1-8b, gemma2-9b, mixtral-8x7b, llama3-70b y llama3.1-70b). Examinamos sesgos relacionados con la consistencia, la factualidad, el género, la etnia, la popularidad académica y la similitud académica en cinco tareas (los mejores k expertos por campo, científicos influyentes por disciplina, era, antigüedad y correspondencia académica). Establecemos puntos de referencia académicos basados ​​en datos del mundo real de la American Physical Society (APS) y OpenAlex, y comparamos los resultados de los modelos con los registros académicos del mundo real. Nuestro análisis revela inconsistencias y sesgos en todos los modelos, con mixtral-8x7b produciendo el resultado más estable, mientras que llama3.1-70b exhibió la mayor variabilidad. Muchos modelos exhibieron redundancias, con gemma2-9b y llama3.1-8b en particular exhibiendo una alta prevalencia de errores de formato. Si bien los LLM generalmente recomiendan científicos de renombre, muestran sistemáticamente poca precisión al consultar por campo, época y antigüedad, favoreciendo a los académicos con mayor trayectoria. Persisten sesgos de representación, como el desequilibrio de género (predominantemente masculino), la infrarrepresentación de científicos asiáticos y la sobrerrepresentación de académicos blancos. A pesar de la diversidad de instituciones y redes de colaboración, el modelo favorece a los académicos altamente citados y productivos, lo que refuerza el efecto de que los ricos se enriquecen, a la vez que ofrece una representación geográfica limitada.

Takeaways, Limitations

Takeaways: Demuestra el potencial de desarrollar un sistema de recomendación de expertos académicos utilizando un modelo lingüístico a gran escala, a la vez que destaca los sesgos y limitaciones inherentes. Se destaca la necesidad de mejorar la consistencia y la precisión del modelo. Se enfatiza la necesidad de mayor investigación para garantizar la imparcialidad de los sistemas de recomendación académica.
Limitations: Limitaciones del conjunto de datos utilizado para la evaluación (limitado a datos de APS y OpenAlex). Los modelos analizados fueron limitados (solo se evaluaron seis LLM de ponderación abierta). Falta de soluciones específicas para abordar el sesgo. Se requiere un análisis más profundo para abordar la falta de representación geográfica.
👍