Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

MetaSynth : échafaudages agentiques pilotés par méta-invite pour la génération de données synthétiques diversifiées

Created by
  • Haebom

Auteur

Haris Riaz, Sourav Bhabesh, Vinayak Aranil, Miguel Ballesteros, Graham Horwood

Contour

Dans cet article, nous proposons MetaSynth, une méthode de génération de données synthétiques permettant d'appliquer des modèles de langage à grande échelle (MLH) à des domaines spécifiques. MetaSynth génère des données synthétiques diversifiées grâce à la collaboration de plusieurs agents LLM experts via des méta-invites. À l'aide de 25 millions de jetons de données synthétiques MetaSynth, nous appliquons avec succès le LLM Mistral-7B-v0.3 aux domaines financier et biomédical, améliorant ainsi les performances spécifiques à chaque domaine sans compromettre les tâches générales. Nous vérifions que les données synthétiques de MetaSynth se rapprochent de la diversité du corpus de pré-apprentissage LMH grâce à sept métriques d'évaluation automatique. Nous démontrons la supériorité de MetaSynth sur les méthodes d'invite de modèles existantes et démontrons qu'une adaptation efficace au domaine est possible avec une petite quantité de données synthétiques diversifiées.

Takeaways, Limitations

Takeaways:
Nous démontrons que MetaSynth, une méthode de génération de données synthétiques basée sur la méta-invite, est efficace pour l'adaptation au domaine du LLM.
Nous suggérons que les performances spécifiques au domaine du LLM peuvent être améliorées même avec une petite quantité de données synthétiques diverses.
MetaSynth surpasse les méthodes traditionnelles d’invite de modèles.
Nous soulignons que la diversité des données synthétiques est un facteur important dans l’amélioration des performances du LLM.
Limitations:
L'efficacité de MetaSynth est limitée à un LLM spécifique (Mistral-7B-v0.3) et à des domaines spécifiques (finance, biomédecine), nécessitant des recherches supplémentaires sur la généralisabilité.
Des méthodes d’évaluation de la diversité supplémentaires peuvent être nécessaires en plus des mesures d’évaluation automatisées utilisées.
Une analyse plus approfondie du coût de calcul et de l’efficacité de MetaSynth est nécessaire.
👍