$ E ^ 2 C $は、大規模言語モデル(LLM)の推論能力を向上させるために設計されたフレームワークであり、推論を高次元戦略計画を作成するナビゲーション段階と選択された計画を実行する実行段階に分けます。このフレームワークは、マップ微調整(SFT)と強化学習(RL)を組み合わせたデュアルステップトレーニング方式を使用し、計画への準拠を強化する新しいデータ生成アルゴリズムをSFTに統合します。 $E^2C$はAIME'2024で他の方法より少ないトークンを使用して高い精度を達成し、ナビゲーション中心のSFT(EF-SFT)を介してクロスドメイン適応性を高め、医療ベンチマークのSFTよりも高い精度を示します。