この論文は、高次元の非凸型Hamilton-Jacobi-Isaacs(HJI)方程式を解く新しいメッシュフリーポリシーの繰り返しフレームワークを提案します。解くと、自動微分を使用した点別最小最大最適化を介して制御を更新するプロセスを繰り返します。可能にします。数値実験は、その方法の正確性とスケーラビリティを示しています。一貫して優れたパフォーマンスを示し、より滑らかな値関数とより低い残差を生成します。結果は、PINNとポリシー反復を統合することが高次元の非凸型HJI方程式を解く実用的で理論的に基づく方法であり、ロボット工学、金融、およびマルチエージェント強化学習に適用される可能性を示唆しています。