Cette page résume et organise les publications en intelligence artificielle du monde entier. Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif. Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.
VerifiAgent : un agent de vérification unifié pour le raisonnement par modèle de langage
Created by
Haebom
Auteur
Jiuzhou Han, Wray Buntine, Ehsan Shareghi
Contour
Les modèles de langage à grande échelle présentent des capacités d'inférence remarquables, mais génèrent souvent des réponses peu fiables ou incorrectes. Les méthodes de vérification existantes sont généralement spécifiques à un modèle ou limitées à un domaine, nécessitent des ressources de calcul importantes et manquent d'évolutivité pour diverses tâches d'inférence. Pour pallier ces limitations, cet article propose VerifiAgent, un agent de vérification intégré intégrant deux niveaux de vérification. La méta-vérification évalue l'exhaustivité et la cohérence des réponses du modèle, tandis que la vérification adaptative basée sur des outils permet à VerifiAgent de sélectionner de manière autonome les outils de vérification appropriés en fonction du type d'inférence, notamment mathématique, logique ou de bon sens. Cette approche adaptative garantit à la fois efficacité et robustesse dans divers scénarios de vérification. Les résultats expérimentaux démontrent que VerifiAgent surpasse les méthodes de vérification de base (par exemple, les vérificateurs déductifs et les vérificateurs rétrospectifs) pour toutes les tâches d'inférence. De plus, le retour d'information sur les résultats de vérification peut être utilisé pour améliorer encore la précision de l'inférence. VerifiAgent peut également être appliqué efficacement à la mise à l'échelle de l'inférence, permettant d'obtenir de meilleurs résultats avec moins d'échantillons générés et à moindre coût par rapport aux modèles de compensation de processus existants dans le domaine de l'inférence mathématique. Le code est disponible à l' adresse https://github.com/Jiuzhouh/VerifiAgent .