Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Quel nom est mentionné ? Audit des recommandations des étudiants titulaires d'un master en droit

Created by
  • Haebom

Auteur

Daniele Barolo, Chiara Valentin, Fariba Karimi, Luis Galarraga, Gonzalo G. Mendez, Lisette Esp in-Noboa

Contour

Cet article évalue les performances de la recommandation d'experts en physique à l'aide de six modèles linguistiques à grande échelle et à pondération ouverte (llama3-8b, llama3.1-8b, gemma2-9b, mixtral-8x7b, llama3-70b et llama3.1-70b). Nous examinons les biais liés à la cohérence, à la factualité, au genre, à l'origine ethnique, à la popularité académique et à la similarité des chercheurs à travers cinq tâches (k meilleurs experts par domaine, scientifiques influents par discipline, époque, ancienneté et correspondance avec les chercheurs). Nous établissons des repères académiques basés sur des données réelles de l'American Physical Society (APS) et d'OpenAlex, et comparons les résultats du modèle aux dossiers académiques réels. Notre analyse révèle des incohérences et des biais dans tous les modèles, mixtral-8x7b produisant le résultat le plus stable, tandis que llama3.1-70b présentait la plus grande variabilité. De nombreux modèles ont présenté des redondances, gemma2-9b et llama3.1-8b affichant notamment une forte prévalence d'erreurs de formatage. Si les LLM recommandent généralement de véritables scientifiques, ils affichent systématiquement une faible précision lors des requêtes par domaine, époque et ancienneté, favorisant les chercheurs confirmés. Des biais de représentation persistent, notamment un déséquilibre entre les sexes (dominance masculine), une sous-représentation des scientifiques asiatiques et une surreprésentation des chercheurs blancs. Malgré la diversité des institutions et des réseaux de collaboration, le modèle privilégie les chercheurs hautement cités et productifs, renforçant ainsi l'effet « riche-devenu-enrichissant » tout en offrant une représentation géographique limitée.

Takeaways, Limitations_

Takeaways : Démontre le potentiel du développement d'un système de recommandation d'experts universitaires utilisant un modèle linguistique à grande échelle, tout en soulignant les biais et les limites inhérents. La nécessité d'améliorer la cohérence et la précision du modèle est soulignée. La nécessité de poursuivre les recherches pour garantir l'équité des systèmes de recommandation universitaires est soulignée.
Limitations : Limites de l’ensemble de données utilisé pour l’évaluation (limité aux données APS et OpenAlex). Les modèles analysés étaient limités (seuls six modèles de maîtrise en droit à pondération ouverte ont été évalués). Absence de solutions spécifiques pour remédier aux biais. Une analyse plus approfondie est nécessaire pour remédier au manque de représentation géographique.
👍