Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Avantages prouvés de l'apprentissage intégré aux outils pour les grands modèles linguistiques

Created by
  • Haebom

Auteur

Sam Houliston, Ambroise Odonnat, Charles Arnal, Vivien Cabannes

Contour

Cet article explore théoriquement les avantages des modèles de langage basés sur des outils (par exemple, la récupération externe, la mémoire et les API). Plus précisément, nous démontrons la supériorité de l'apprentissage basé sur des outils (récupération externe) sur l'apprentissage pondéré (mémorisation) en termes de représentation d'informations factuelles. Bien que le nombre de paramètres du modèle limite fondamentalement le nombre de faits mémorisables, nous démontrons que l'apprentissage basé sur des outils permet une représentation infinie des faits grâce à des circuits simples et efficaces. Des expériences contrôlées démontrent que les modèles basés sur des outils surpassent les modèles de mémorisation, démontrant ainsi que l'enseignement de l'apprentissage basé sur des outils et des règles générales est plus efficace que la mémorisation de faits dans un modèle de langage pré-entraîné à grande échelle. En conclusion, nous démontrons, par des preuves théoriques et expérimentales, que les flux de travail basés sur des outils sont non seulement pratiques, mais aussi théoriquement supérieurs en termes d'évolutivité.

Takeaways, Limitations

Takeaways:
En élucidant la supériorité théorique des modèles de langage basés sur des outils, nous soulignons l’importance de l’utilisation des outils.
Nous révélons les limites de l’apprentissage pondéré (mémorisation) et démontrons l’évolutivité infinie de l’apprentissage instrumental (recherche externe).
Nous validons expérimentalement l’efficacité de l’apprentissage basé sur des outils sur des modèles linguistiques à grande échelle pré-entraînés.
Nous fournissons un soutien théorique et expérimental sur la praticité et l'évolutivité des flux de travail basés sur des outils.
Limitations:
Cet article se concentre principalement sur la représentation des informations factuelles, et la généralisabilité à d’autres types de tâches de modélisation du langage nécessite des recherches supplémentaires.
ÉTant donné que l’environnement expérimental était contrôlé, les performances de généralisation dans des situations complexes du monde réel nécessitent une validation supplémentaire.
L’efficacité de l’utilisation d’un outil peut être affectée par la qualité et l’accessibilité de l’outil, et ces variables peuvent ne pas être prises en compte.
👍