Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

FRIDA à la rescousse ! Analyse de l'efficacité des données synthétiques dans le raisonnement de bon sens basé sur les objets pour la réponse aux catastrophes.

Created by
  • Haebom

Auteur

Mollie Shichman, Claire Bonial, Austin Blodgett, Taylor Hudson, Francis Ferraro, Rachel Rudinger

Contour

Cet article présente le potentiel d'exploitation des capacités de raisonnement physique des modèles linguistiques à grande échelle (MLE) pour l'interaction homme-robot (IH) en situation de secours. Afin de répondre aux contraintes de taille des LLE existants, nous proposons un ensemble de données et un pipeline pour générer un modèle d'agent de raisonnement et de décodage d'instructions sur le terrain (FRIDA). En combinant les connaissances d'experts du domaine et de linguistes, nous générons des invites de haute qualité, peu nombreuses, qui sont ensuite utilisées pour affiner un petit modèle optimisé par les instructions à l'aide de données synthétiques. Nous démontrons expérimentalement qu'un modèle FRIDA entraîné uniquement sur l'état physique et les données de caractéristiques des objets surpasse les modèles entraînés entièrement sur des données synthétiques et des modèles de base, démontrant ainsi sa capacité à inculquer le bon sens physique avec un minimum de données.

Takeaways, Limitations

Takeaways:
Suggérer la possibilité d'utiliser de petits LLM pour doter les robots de secours en cas de catastrophe de capacités de raisonnement physique.
Présentation d'une méthode permettant de générer des données de haute qualité et de former des modèles efficaces grâce à la collaboration entre experts du domaine et linguistes.
Nous révélons que l’état physique et les données fonctionnelles des objets sont des facteurs importants pour améliorer les performances d’inférence physique.
Nous démontrons qu’un réglage fin efficace du LLM est possible avec un minimum de données.
Limitations:
Des recherches supplémentaires sont nécessaires pour évaluer les performances de généralisation du pipeline FRIDA actuellement proposé et son applicabilité à diverses situations de catastrophe.
Dégradation potentielle des performances en raison des limitations de la qualité et de la quantité des données synthétiques utilisées.
Manque de validation expérimentale dans des environnements de catastrophe réels.
Une évaluation des performances est nécessaire pour des tâches de raisonnement physique plus diverses et plus complexes.
👍