Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Boucles d'entraînement récursives dans les LLM : comment les propriétés des données d'entraînement modulent le changement de distribution dans les données générées ?

Created by
  • Haebom

Auteur

Grgur Kova\v{c}, J er emy Perez, R emy Portelas, Peter Ford Dominey, Pierre-Yves Oudeyer

Contour

Cet article étudie le phénomène d'effondrement de modèle qui se produit lors de l'apprentissage itératif d'un modèle linguistique à grande échelle (MLL) à l'aide de données synthétiques générées par le LLM. Plus précisément, nous analysons empiriquement l'impact des caractéristiques des données humaines sur ce changement distributionnel. À l'aide de divers ensembles de données humaines, nous effectuons un apprentissage itératif et, par la manipulation des caractéristiques des ensembles de données et une analyse de régression, identifions les caractéristiques des données qui prédisent l'ampleur du changement distributionnel. Nous constatons que la diversité lexicale amplifie le changement distributionnel, tandis que la diversité sémantique et la qualité des données l'atténuent. De plus, nous démontrons que ces effets sont modulaires, ce qui signifie que les données collectées sur un domaine Internet spécifique ont peu d'influence sur la création de contenu dans d'autres domaines. Enfin, des expériences sur les biais politiques démontrent que les caractéristiques des données humaines influencent l'amplification ou la réduction des biais initiaux. En conclusion, nous proposons une nouvelle perspective sur la manière dont différentes parties d'Internet peuvent connaître différents types de changements distributionnels.

Takeaways, Limitations

Takeaways:
Nous identifions les caractéristiques des données (diversité lexicale, diversité sémantique et qualité des données) qui prédisent l’ampleur des changements de distribution qui se produisent au cours du processus d’apprentissage itératif du LLM.
Nous présentons la modularité de l'impact des caractéristiques du domaine des données Internet sur la création de contenu en LLM.
Analyse de l’impact des caractéristiques des données humaines sur les préjugés politiques dans les LLM.
Démontre la diversité des changements de distribution qui se produisent dans différents domaines de l’Internet.
Limitations:
Restrictions sur le type et la portée des ensembles de données et des fonctionnalités utilisés dans l'analyse.
Des recherches supplémentaires sont nécessaires sur la généralisabilité des mesures quantitatives des changements de distribution et des modèles de prédiction.
La vérification de la généralisabilité est nécessaire pour diverses architectures LLM et méthodologies d’apprentissage.
Des recherches supplémentaires sont nécessaires sur la portée et les limites de la modularité, ce qui signifie que l’influence d’un domaine spécifique ne s’étend pas à d’autres domaines.
👍