本論文は,Banditアルゴリズムのクラスタリング手法(CB)をニューラルネットワークに基づいて拡張したCNB(Clustering of Neural Bandits)アルゴリズムのLimitationsである'プラスティシティ損失'問題を解決するために,Selective Reinitialization(SeRe)フレームワークを提案する。 CNBは同様のバンドをクラスタリングしてパフォーマンスを向上させますが、時間の経過とともにニューラルネットワークパラメータが固定され、異常な環境に適応するのが困難になります。 SeReは貢献ユーティリティメトリックを使用して、利用率の低いユニットを選択的に再初期化し、プラスティシティの損失を軽減し、安定した知識を維持することを同時に実現します。また、異常度合いに応じて再初期化の頻度を調整する適応型変化検出メカニズムにより、不要な再初期化なしに効果的な適応を保証します。理論的には、SeReは区間的に通常の環境で下位線形累積後悔を達成することを実証し、実際の6つの推奨データセットに対する実験は、従来のCNBアルゴリズムよりも低い後悔と改善された適応性と堅牢性を示しています。