Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Du long au court : les LLM excellent dans l'affinement de leurs propres chaînes de raisonnement

Created by
  • Haebom

Auteur

Wei Han, Geng Zhan, Sicheng Yu, Chenyu Wang et Bryan Hooi

Contour

Cet article souligne que si les modèles d'inférence à grande échelle (MRL) excellent dans les tâches d'inférence complexes, ils souffrent d'un problème de « sur-réflexion », générant des chemins d'inférence excessifs, même pour des problèmes simples. Pour y remédier, nous proposons l'Efficient Dynamic Inference Trimming (EDIT), une nouvelle méthode de mise à l'échelle du temps de test qui concilie les objectifs contradictoires de précision et de concision. EDIT trouve efficacement les chemins d'inférence les plus courts et les plus précis grâce à une génération basée sur des contraintes, en suivant simultanément la longueur et la distribution des réponses afin de sélectionner celles qui atteignent l'équilibre optimal entre concision et précision. Les résultats expérimentaux obtenus sur divers modèles et ensembles de données démontrent qu'EDIT améliore significativement l'efficacité de l'inférence, produisant des résultats concis mais informatifs, améliorant la lisibilité et l'expérience utilisateur.

Takeaways, Limitations

Takeaways:
Nous présentons l'algorithme EDIT, une méthode efficace pour résoudre le problème de la réflexion excessive.
Améliore l’efficacité d’inférence de LRM, ce qui donne des résultats plus concis et plus compréhensibles.
Nous présentons une nouvelle approche qui équilibre efficacement précision et simplicité.
Générer des résultats qui peuvent contribuer à améliorer l’expérience utilisateur.
Limitations:
Les performances d'EDIT peuvent varier en fonction du LRM et de l'ensemble de données utilisés.
Des recherches supplémentaires sur la définition des contraintes et l’optimisation peuvent être nécessaires.
Une validation supplémentaire des performances de généralisation de l’EDIT actuellement proposé est nécessaire.
Il peut y avoir un manque d’évaluation de l’efficacité de l’EDIT pour les problèmes extrêmement complexes.
👍