Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Effets de la structure sur le raisonnement dans l'auto-découverte au niveau de l'instance

Created by
  • Haebom

Auteur

Sachith Gunasekara, Yasiru Ratnayake

Contour

Cet article souligne que la demande d'inférences LLM prévisibles dans les systèmes complexes a popularisé les résultats structurés, mais des inquiétudes subsistent quant à leurs faibles performances par rapport au langage naturel non structuré. L'entraînement sur des données de trace de chaîne de pensée (CoT) non structurées a permis de développer de nouveaux modèles d'inférence performants, mais il soulève des problèmes de coûts de calcul et de fiabilité. Dans cet article, nous présentons iSelf-Discover, une adaptation au niveau instance du framework Self-Discover, et comparons les inférences JSON structurées générées dynamiquement aux inférences non structurées. Les résultats expérimentaux obtenus sur différents benchmarks montrent que les inférences non structurées surpassent systématiquement les inférences structurées. En particulier, sur le benchmark MATH complexe, les plans non structurés obtiennent jusqu'à 18,90 % de gain de performance relatif par rapport aux approches structurées. La variante non structurée à zéro coup d'iSelf-Discover surpasse la variante structurée à cinq coups, soulignant que ces différences sont importantes même lorsque les inférences sont générées dynamiquement avant la réponse finale. De plus, nous montrons que la granularité optimale de génération de plan (niveau instance vs niveau tâche) varie selon le contexte. Ces résultats suggèrent que nous devons réévaluer notre recours aux formats structurés pour résoudre des problèmes complexes et la manière dont nous structurons les systèmes complexes.

Takeaways, Limitations

Takeaways:
Il a été démontré expérimentalement que le raisonnement non structuré peut surpasser le raisonnement structuré dans la résolution de problèmes complexes.
Selon l'indice de référence MATH, le plan non structuré surpasse le plan structuré jusqu'à 18,90 %.
Les modèles non structurés à zéro coup surpassent les modèles structurés à cinq coups.
Il est suggéré que la granularité optimale de la génération de plan dépend des caractéristiques de la tâche.
Suggérant la nécessité de reconsidérer les dépendances aux formes structurées dans la conception de systèmes complexes.
Limitations:
Les résultats peuvent être limités à des repères et modèles spécifiques.
Des recherches supplémentaires sur différents types de problèmes et de modèles sont nécessaires.
Des analyses plus approfondies sont nécessaires sur les problèmes de coût de calcul et de fiabilité.
Manque de directives claires sur la détermination de la granularité à laquelle générer des plans optimaux.
👍