Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

La chaîne de pensée pense toujours vite : APriCoT aide à penser lentement

Created by
  • Haebom

Auteur

Kyle Moore, Jesse Roberts, Thao Pham, Douglas Fisher

Contour

Cet article étudie l'impact du biais du modèle linguistique sur les préférences de choix de réponse dans la tâche de compréhension du langage multitâche massive (MMLU). Les résultats montrent que le biais du modèle linguistique prédit les préférences du modèle et reflète les stratégies humaines de passation de tests, même en utilisant l'inférence CoT. Pour résoudre ce problème, les auteurs introduisent l'incitation contrefactuelle et l'incitation CoT indiscriminée (APriCoT). Si l'incitation contrefactuelle seule utilisant l'incitation CoT ne suffit pas à atténuer le biais, l'APriCoT réduit efficacement l'influence de la probabilité sous-jacente et améliore la précision globale. L'incitation CoT tend à renforcer le biais du modèle de pensée rapide sous certaines méthodes d'incitation, suggérant que la pensée lente est nécessaire pour atténuer le biais. L'APriCoT représente une étape vers le développement d'un modèle linguistique de « pensée lente » plus robuste et plus juste.

Takeaways, Limitations_

Takeaways:
Nous révélons que le biais du modèle linguistique influence considérablement le choix des réponses dans des tâches telles que MMLU.
Le CoT seul ne résout pas complètement le biais du modèle, ce qui suggère la nécessité d'un processus de « réflexion lente ».
Nous démontrons qu’APriCoT réduit efficacement les biais et améliore la précision par rapport aux méthodes existantes.
Limitations:
Des recherches supplémentaires sont nécessaires pour déterminer si les effets d’APriCoT peuvent être généralisés à tous les types de biais ou à tous les modèles linguistiques.
Une analyse plus approfondie du coût informatique et de l’efficacité d’APriCoT est nécessaire.
Il manque des critères clairs pour définir et mesurer la « pensée lente ».
👍