この論文では、ターゲット分布からのサンプリング時に既存のサンプラーの追加ガイドを組み込む新しい意思決定フロー(DF)フレームワークを紹介します。 DFは、確率的最適制御におけるマルコフ意思決定プロセス(MDP)アプローチのAIベースのアルゴリズム的生まれ変わりと見なすことができます。 [Behjoo, Chertkov 2025]の連続空間、連続時間経路積分拡散サンプリング手法を離散時間および空間に拡張するとともに、[Bengio, et al 2021]の生成フローネットワーク(GFN)フレームワークを一般化します。最も基本的な形式では、ニューラルネットワーク(NN)を必要としない明示的な式を使用して、DFは既存のサンプラーの遷移確率を調整するために基底MDPの線形プールが可能である[Todorov、2007]を利用します。結果として生じるマルコフプロセスは、既存のサンプリングの逆時間グリーン関数と標的分布の合成積として表される。イージングモデルでのサンプリングの例では、DFフレームワークを示し、効率を定量化するためにメトロポリスヘイスティングスとDFを比較し、潜在的なNNベースの拡張について議論し、さまざまなアプリケーションでDFがガイド付きサンプリングをどのように改善できるかについての概要を説明します。