本論文は、強化学習(RL)の補償関数が部分モジュラー関数である場合を扱います。既存のRLでは補償関数が加算的であると仮定しているが、経路計画や適用制御など実際の問題では減少収益を示す部分モジュラー関数としてモデル化する方がより適切である。本論文では、部分モジュラー補償関数を有するRL問題について、部分モジュラーグラフベースの剪定技法を提案する。この手法は、計算可能な時間内に近似的な最適ポリシーを見つけることを証明し、時間と空間の複雑さとパフォーマンスの保証を分析します。既存の研究で使用されたベンチマーク環境を用いた実験の結果、提案された技術が従来の方法よりも高い報酬を得ることが確認された。