Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Améliorer la diversité dans les grands modèles linguistiques grâce aux processus ponctuels déterminants

Created by
  • Haebom

Auteur

Yilei Chen, Souradip Chakraborty, Lorenz Wolf, Ioannis Ch. Paschalidis, Aldo Pacchiano

Contour

Cet article met en évidence le problème suivant : l'apprentissage par ajustement fin supervisé et par renforcement, en tant que méthodes post-apprentissage pour les modèles linguistiques à grande échelle (MLH), améliore les performances des modèles, mais réduit la diversité des résultats, ce qui conduit à des réponses étroites et typiques. Les méthodes existantes d'amélioration de la diversité présentent des limites, opérant au moment de l'inférence ou se concentrant uniquement sur les différences lexicales. En réponse, cet article propose DQO, une nouvelle méthode d'apprentissage basée sur le processus de point de décision (PPD). DQO échantillonne et intègre plusieurs réponses pour chaque invite, mesurant la diversité en mesurant le volume occupé par ces intégrations de réponses. Des expériences sur diverses tâches (suivi de direction, résumé, génération d'histoires et inférence) démontrent que DQO améliore significativement la diversité sémantique sans compromettre la qualité du modèle.

Takeaways, Limitations_

Takeaways:
Nous présentons une nouvelle méthode de formation (DQO) qui optimise simultanément la qualité et la diversité sémantique des LLM en utilisant le processus de point de décision (DPP).
Surmonter les limites des méthodes existantes, comme se concentrer sur les opérations d’inférence ou les différences lexicales.
Efficacité démontrée dans le maintien de la qualité du modèle tout en améliorant la diversité sémantique dans diverses tâches.
Limitations:
La complexité de calcul des méthodes de mesure de la diversité basées sur DPP peut être élevée.
Il peut y avoir une dépendance à l’utilisation d’un type spécifique de noyau.
Des recherches supplémentaires sont nécessaires sur les performances de généralisation de la méthode proposée.
👍