Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

HuggingGraph : Comprendre la chaîne d'approvisionnement de l'écosystème LLM

Created by
  • Haebom

Auteur

Mohammad Shahedur Rahman, Peng Gao, Yuede Ji

Contour

Cet article présente des recherches visant à identifier les vulnérabilités, les biais et les composants malveillants dans la chaîne d'approvisionnement des modèles linguistiques à grande échelle (LLM), à améliorer l'équité des modèles et à garantir la conformité aux cadres réglementaires. Étant donné que les LLM existants abordent inévitablement ces problèmes en raison de leur dépendance à des modèles de base, des modèles pré-entraînés et des jeux de données externes, nous étudions la chaîne d'approvisionnement des LLM en nous concentrant sur les relations entre modèles et jeux de données. À cette fin, nous concevons une méthodologie pour collecter systématiquement les informations de la chaîne d'approvisionnement des LLM et construisons un nouveau graphe hétérogène orienté (402 654 nœuds et 462 524 arêtes) représentant les relations entre modèles et jeux de données. Ce graphe est ensuite utilisé pour effectuer diverses analyses et produire plusieurs résultats intéressants.

Takeaways, Limitations

Takeaways: Présentation d'une méthodologie systématique et d'un modèle de données pour l'analyse de la chaîne d'approvisionnement LLM, identification et analyse de la source des vulnérabilités, des biais et des composants malveillants dans LLM, et contribution à l'amélioration de l'équité du modèle et de la conformité réglementaire.
Limitations: Le résumé ne présente pas explicitement les résultats spécifiques de l'analyse et leurs implications. La portée et les limites de l'ensemble de données utilisé dans l'analyse sont insuffisamment décrites. Un examen plus approfondi est nécessaire pour déterminer la généralisabilité et l'évolutivité de la méthodologie proposée.
👍