Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

LTLCrit : un critique LLM basé sur la logique temporelle pour des agents incarnés sûrs et efficaces

Created by
  • Haebom

Auteur

Anand Gokhale, Vaibhav Srivastava, Francesco Bullo

Contour

Dans cet article, nous proposons une architecture acteur-critique modulaire composée d'un acteur LLM et d'un critique LLM basé sur la logique temporelle linéaire (LTLCrit). Cette architecture vise à surmonter les limitations des modèles de langage à grande échelle (LLM), dont la sécurité et l'efficacité sont faibles en raison de l'accumulation d'erreurs lors des tâches de planification à long terme. L'acteur LLM sélectionne des actions de haut niveau grâce à des observations en langage naturel, et LTLCrit analyse l'ensemble du chemin pour proposer de nouvelles contraintes LTL empêchant toute action future dangereuse ou inefficace. L'architecture prend en charge à la fois des contraintes de sécurité fixes spécifiées manuellement et des contraintes souples d'apprentissage adaptatif qui améliorent l'efficacité à long terme, et est indépendante du modèle. Nous démontrons la capacité de prise de décision sûre et généralisable du LLM avec une supervision mutuelle basée sur la logique, en atteignant un taux d'achèvement de 100 % et une efficacité améliorée par rapport au planificateur LLM existant sur le benchmark d'extraction de diamants Minecraft.

Takeaways, Limitations

Takeaways:
Présentation d'une nouvelle architecture modulaire pour améliorer les capacités de planification à long terme du LLM.
Une nouvelle approche pour garantir la sécurité et l’efficacité du LLM en tirant parti du LTL.
Architecture indépendante du modèle pouvant être appliquée à divers planificateurs basés sur LLM.
Performances vérifiées avec un taux d'achèvement de 100 % et une efficacité améliorée dans Minecraft Benchmark.
Présentation de la possibilité d'une prise de décision sûre et généralisable en LLM grâce à une supervision mutuelle basée sur la logique.
Limitations:
Des expériences supplémentaires et une vérification des performances de généralisation de l’architecture proposée sont nécessaires.
Des recherches supplémentaires sont nécessaires sur l’applicabilité et l’évolutivité à divers environnements et tâches.
Il est nécessaire d’améliorer la complexité et l’efficacité de calcul de LTLCrit.
Il convient de prendre en compte les limites et les complexités de l’expression des contraintes via LTL.
👍