Safe Reinforcement Learning in Black-Box Environments via Adaptive Shielding
Created by
Haebom
作者
Daniel Bethell, Simos Gerasimou, Radu Calinescu, Calum Imrie
概要
本論文は強化学習(RL)エージェントの安全な探索のための新しい後処理技術であるADVICE(Adaptive Shielding with a Contrastive Autoencoder)を提示します。既存の知識のないブラックボックス環境でRLエージェントを訓練する際に発生する安全リスクを軽減することに焦点を当てています。 ADVICEは、状態と行動のペアの安全な機能と不安全な機能を区別し、それによって危険な結果をもたらす可能性の高い行動を実行するのを防ぐためにエージェントを保護します。実験の結果、既存の安全強化学習探索手法に比べて安全違反を約50%減少させながら競争力のある補償結果を達成しました。