本論文は,将来の人工エージェントの強制終了抵抗問題に対する解決策として,POST-Agents提案を提示する。 POST(Preferences Only Between Same-Length Trajectories)は、同じ長さの軌跡の間でのみ好みを満たすようにエージェントを訓練する方法です。論文は、POSTと他の条件が一緒に満たされると、エージェントが軌道長の確率分布を無視し、期待効果を最大化するNeutrality +を保証することを証明します。 Neutrality+は、エージェントの終了可能性を維持しながら有用性を可能にするという主張が提示されています。