Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Causalité curieuse - Les agents en quête d'apprentissage du monde métacausal

Created by
  • Haebom

Auteur

Zhiyu Zhao, Haoxuan Li, Haifeng Zhang, Jun Wang, Francesco Faccio, Jurgen Schmidhuber, Mengyue Yang

Contour

Cet article remet en question l'hypothèse courante en modélisation du monde selon laquelle les lois causales sous-jacentes sont uniques et invariantes. En réalité, en raison de fenêtres d'observation étroites, les mécanismes sous-jacents fixes apparaissent souvent comme des mécanismes causaux évolutifs. Par conséquent, même des changements subtils dans les politiques ou les états environnementaux peuvent modifier les mécanismes causaux observés. Pour y remédier, cet article propose un modèle du monde appelé **Graphique Méta-Causal**, une représentation minimale et unifiée qui code efficacement l'évolution des structures causales en fonction des états potentiels du monde. Le graphe méta-causal est constitué de plusieurs sous-graphes causaux, chacun activé par un méta-état (dans l'espace des états potentiels). Sur la base de cette représentation, cet article présente un **Agent en quête de causalité** qui (1) identifie les méta-états qui activent chaque sous-graphe, (2) découvre les relations causales correspondantes grâce à la politique d'intervention motivée par la curiosité d'un agent, et (3) affine itérativement le graphe méta-causal par une exploration continue motivée par la curiosité et l'expérience de l'agent. Des expériences sur des tâches de manipulation de bras synthétiques et robotiques démontrent que la méthode proposée capture de manière robuste les variations de la dynamique causale et se généralise efficacement à des contextes jusque-là inédits.

Takeaways, Limitations

Takeaways:
Nous présentons un modèle mondial qui fonctionne de manière robuste même dans des environnements où les relations causales changent.
Les graphiques métacausaux offrent une nouvelle façon de représenter efficacement diverses structures causales.
L’exploration guidée par la curiosité de l’agent lui permet d’améliorer continuellement son modèle du monde.
Nous validons expérimentalement l'efficacité de la méthode proposée sur des tâches robotiques synthétiques et réelles.
Limitations:
Des recherches supplémentaires sont nécessaires pour définir et identifier les métastases.
L’évolutivité des graphes métacausaux dans des environnements complexes et de grande dimension doit être examinée.
Des recherches sont nécessaires sur les moyens d’améliorer l’efficacité des politiques d’intervention fondées sur la curiosité des agents.
En raison des limitations de l’environnement expérimental, une validation supplémentaire des performances de généralisation est nécessaire.
👍