Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Inférence frugale pour le contrôle

Created by
  • Haebom

Auteur

Itzel Olivos-Castillo, Paul Schrater, Xaq Pitkow

Contour

Cet article aborde le défi de l'équilibre entre maximisation de l'utilité et utilisation des ressources, incluant les mouvements externes et le calcul interne, dans le développement de l'intelligence artificielle. Bien que ce compromis ait été étudié dans des environnements entièrement observables, notre compréhension de l'efficacité des ressources dans des environnements partiellement observables reste limitée. Pour relever ce défi, nous développons une variante du cadre POMDP qui traite l'information obtenue par inférence comme une ressource à optimiser, parallèlement à la performance et à l'effort. En résolvant ce problème dans un contexte décrit par la dynamique linéaire-gaussienne, nous mettons en évidence les principes fondamentaux de l'efficacité des ressources. Nous observons une transition de phase dans l'inférence, passant d'une approche optimale bayésienne à une approche qui laisse stratégiquement une certaine incertitude non résolue. Ce comportement frugal génère un ensemble structuré de stratégies efficaces, facilitant l'adaptation aux objectifs et contraintes ultérieurs négligés dans le processus d'optimisation initial. Nous démontrons l'applicabilité du cadre et la généralité des principes dérivés à l'aide de deux tâches non linéaires. Globalement, cette recherche pose les bases d'un nouveau type de calcul rationnel, utilisable aussi bien par le cerveau que par les machines pour un contrôle efficace et économe en ressources dans des conditions d'incertitude.

Takeaways, Limitations

Takeaways: Un nouveau cadre POMDP pour une prise de décision efficace en termes de ressources dans des environnements partiellement observables, la découverte d'une transition de phase de l'optimisation bayésienne au maintien de l'incertitude stratégique, une adaptabilité améliorée aux objectifs et contraintes ultérieurs, et un modèle de calcul raisonnable applicable à la fois aux cerveaux et aux machines.
Limitations: Généralisabilité limitée en raison d'hypothèses sur la dynamique linéaire-gaussienne, gamme limitée d'exemples d'application à des tâches non linéaires, manque d'application et de vérification aux systèmes réels.
👍