Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Amélioration du réglage fin supervisé pour les grands modèles de langage afin d'atténuer les oublis catastrophiques

Created by
  • Haebom

Auteur

Fei Ding, Baiqiao Wang

Contour

Dans cet article, nous présentons une nouvelle méthode pour résoudre le problème d'oubli catastrophique qui survient dans les méthodes de réglage fin supervisé (SFT) afin d'améliorer la capacité de suivi des instructions des modèles de langage à grande échelle (LLM) open source. Sans accès aux données SFT originales, nous reconstruisons la distribution des instructions du modèle de base et synthétisons un ensemble de données polyvalent de haute qualité grâce à un pipeline de génération et de filtrage multi-modèles. En combinant cet ensemble de données synthétiques avec de nouvelles données spécifiques au domaine et en l'affinant, nous démontrons expérimentalement qu'il améliore les performances de tâches spécifiques sans dégrader les performances dans le domaine général.

Takeaways, Limitations

Takeaways:
Nous présentons une nouvelle méthode SFT qui atténue efficacement le problème de l’oubli catastrophique sans accéder aux données SFT existantes.
Nous démontrons que l’utilisation d’ensembles de données synthétiques peut améliorer les performances du LLM de manière rentable.
Obtenez à la fois des améliorations de performances générales et de performances de tâches spécifiques.
Présenter la possibilité d'accroître la praticité du LLM open source.
Limitations:
La qualité des ensembles de données synthétiques peut être inférieure à celle des ensembles de données réels.
Une validation supplémentaire des performances de généralisation de la méthode proposée est nécessaire.
Dépendances possibles sur des domaines et des modèles spécifiques.
La complexité et le coût de calcul du processus de génération de données synthétiques.
👍