本論文は,大規模モデルで制御されたインテリジェントエージェントで新たな課題に直面したときに劣化を引き起こす致命的な忘却問題に対する解決策として,Progressive Prompt Decision Transformer(P2DT)を提案する。 P2DTは、新たな課題学習中に意思決定トークンを動的に追加し、トランスベースのモデルを強化することで課題別の方針を促進します。これは、継続的およびオフライン強化学習シナリオで忘却を軽減します。さらに、P2DTは、すべての課題で既存の強化学習を通じて収集された軌跡を活用し、学習中に新しい課題別トークンを生成し、以前の学習の知識を維持します。当初の結果は,本モデルが致命的な忘却を効果的に緩和し,増加する課題環境でうまく拡張したことを示した。