Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

MeLA : une architecture métacognitive pilotée par LLM pour la conception heuristique automatique

Created by
  • Haebom

Auteur

Zishang Qiu, Xinan Chen, Long Chen, Ruibin Bai

Contour

Cet article présente l'architecture métacognitive basée sur le LLM (MeLA), un nouveau paradigme pour la conception heuristique automatisée (AHD). Contrairement aux méthodes évolutionnaires existantes qui font évoluer directement le code heuristique lui-même, MeLA fait évoluer des invites directionnelles qui guident un modèle de langage à grande échelle (LLM) pour générer des heuristiques. Ce processus d'« évolution des invites » s'appuie sur un nouveau cadre métacognitif qui affine systématiquement la stratégie de génération en analysant les retours de performance. L'architecture de MeLA intègre un analyseur de problèmes qui construit des invites stratégiques initiales, un système de diagnostic d'erreurs qui corrige le code défectueux et un moteur de recherche métacognitif qui optimise itérativement les invites en fonction de l'efficacité heuristique. Lors d'expériences approfondies sur des problèmes de référence et réels, MeLA surpasse systématiquement les méthodes de pointe existantes, générant des heuristiques plus efficaces et plus robustes. En fin de compte, cette étude démontre le potentiel de l’utilisation des sciences cognitives comme modèle pour l’architecture de l’IA, démontrant que le LLM peut guider de manière métacognitive les processus de résolution de problèmes, ouvrant ainsi une voie plus robuste et interprétable vers l’AHD.

Takeaways, Limitations

Takeaways:
Un nouveau paradigme de conception heuristique automatisée (AHD) utilisant LLM est présenté.
Créer des heuristiques plus efficaces et plus puissantes en faisant évoluer les invites via un cadre métacognitif.
Des performances démontrées qui surpassent les méthodes AHD les plus performantes existantes
Démontrer le potentiel de la conception d’architecture d’IA basée sur les sciences cognitives.
Offrir une approche AHD plus interprétable
Limitations:
Les performances de MeLA peuvent dépendre de LLM spécifiques et de techniques d'ingénierie rapides.
Des recherches supplémentaires sont nécessaires pour déterminer les performances de généralisation de MeLA à des problèmes complexes.
Une validation supplémentaire de la généralité et de l’extensibilité du cadre métacognitif à d’autres domaines problématiques est nécessaire.
Une évaluation plus approfondie de l’efficacité et de l’évolutivité de MeLA dans les applications du monde réel est nécessaire.
👍