本論文は、強化学習(RL)を用いた視覚誘導4足歩行ロボット制御を扱い、堅牢な制御のために固有受容性(proprioception)と視覚情報の結合が必須であることを強調します。 Kolmogorov-Arnold Networks(KAN)を使用したスプラインパラメータ化されたクロスモーダルポリシーであるQuadKANを提案します。 QuadKANは、固有の水溶性のためのスプラインエンコーダと、固有の水溶性 - 視覚情報のためのスプライン融合ヘッドを統合しています。これらの構造化関数クラスは、状態 - 行動マッピングを歩行の断片的な滑らかな特性と整列させることで、サンプル効率を向上させ、振る舞いとエネルギー消費を減らし、解釈可能な姿勢 - 行動感度を提供します。マルチモード遅延ランダム化(MMDR)を採用し、Proximal Policy Optimization(PPO)でエンドツーエンド学習を実行します。均一で不均一な表面、静的または動的障害物があるシナリオなど、さまざまな地形での評価の結果、QuadKANは最先端(SOTA)基準モデルよりも一貫して高い収益、より長い移動距離、およびより少ない衝突を達成することを示しています。これらの結果は、スプラインでパラメータ化されたポリシーが堅牢な視覚誘導歩行のための単純で効果的で解釈可能な代替案であることを示しています。