Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Réfléchir comment penser : atténuer la réflexion excessive grâce à la cognition autonome des difficultés dans les grands modèles de raisonnement

Created by
  • Haebom

Auteur

Yongjiang Liu, Haoxi Li, Xiaosong Ma, Jie Zhang, Song Guo

Contour

Cet article propose une nouvelle stratégie de réglage fin en deux étapes, Think-How-to-Think (TH2T), pour résoudre le problème de l'inférence excessive dans les modèles d'inférence à grande échelle (LRM). TH2T injecte d'abord une prise en compte du niveau de difficulté dans le modèle afin d'ajuster la profondeur d'inférence, puis réduit l'inférence excessive en identifiant et en supprimant les schémas d'inférence inutiles aux étapes intermédiaires. L'apprentissage s'appuie sur un ensemble de données combinant des chemins d'inférence courts et longs. Les résultats expérimentaux obtenus sur les modèles 7B, 14B et 32B démontrent qu'elle maintient les performances tout en réduisant les coûts d'inférence de plus de 70 % sur les tâches faciles et de plus de 40 % sur les tâches difficiles.

Takeaways, Limitations

Takeaways:
Une nouvelle méthode pour résoudre efficacement le problème de sur-inférence dans les modèles linguistiques à grande échelle est présentée.
Augmentez l’efficacité du modèle sans compromettre les performances tout en réduisant considérablement les coûts d’inférence.
Amélioration de la capacité du modèle à reconnaître la difficulté d’une tâche et à ajuster son processus d’inférence en conséquence.
Augmentez l’efficacité du processus d’inférence en éliminant les répétitions inutiles ou les informations inutiles dans les étapes d’inférence intermédiaires.
Limitations:
Des recherches supplémentaires sont nécessaires pour déterminer la généralité de la méthode proposée (des expériences sur différents types de problèmes et de modèles sont nécessaires).
Des explications détaillées sur les méthodes de mise en œuvre spécifiques de « l’hypnose de difficulté » et de « l’hypnose de redondance » peuvent faire défaut.
Il existe un risque de dépendance à un ensemble de données spécifique. Il existe également un risque de dégradation des performances lors de l'extension à d'autres ensembles de données.
👍