Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Apprentissage par renforcement sécurisé dans les environnements de boîte noire via le blindage adaptatif

Created by
  • Haebom

Auteur

Daniel Bethell, Simos Gerasimou, Radu Calinescu, Calum Imrie

Contour

Cet article présente ADVICE (Adaptive Shielding with a Contrastive Autoencoder), une nouvelle technique de post-traitement pour l'exploration sécurisée des agents d'apprentissage par renforcement (RL). Elle vise à réduire les risques de sécurité liés à l'apprentissage par renforcement dans des environnements de type boîte noire, sans connaissances préalables. ADVICE distingue les caractéristiques sûres et non sûres des paires état-action, protégeant ainsi l'agent contre les actions susceptibles d'entraîner des résultats dangereux. Les résultats expérimentaux démontrent qu'elle réduit les violations de sécurité d'environ 50 % par rapport aux techniques d'exploration RL sécurisées existantes, tout en offrant des avantages compétitifs.

Takeaways, Limitations

Takeaways:
Nous présentons une technique de post-traitement efficace pour une navigation sécurisée des agents RL dans des environnements de boîte noire.
Atteignez des performances compétitives tout en réduisant considérablement les violations de sécurité.
Une nouvelle approche permettant de distinguer les caractéristiques sûres/non sûres des paires état-action est présentée.
Limitations:
Les performances d'ADVICE peuvent dépendre des performances de l'autoencodeur contrastif.
Des recherches supplémentaires sont nécessaires sur les performances de généralisation dans différents environnements et tâches.
Il convient de prendre en compte les problèmes de sécurité supplémentaires qui peuvent survenir dans les applications réelles.
👍