본 논문은 강화학습(RL)을 이용한 시각 유도 4족 보행 로봇 제어를 다루며, 강건한 제어를 위해 고유수용성(proprioception)과 시각 정보의 결합이 필수적임을 강조합니다. Kolmogorov-Arnold Networks (KANs)를 사용한 스플라인 매개변수화된 크로스-모달 정책인 QuadKAN을 제안합니다. QuadKAN은 고유수용성을 위한 스플라인 인코더와 고유수용성-시각 정보를 위한 스플라인 융합 헤드를 통합합니다. 이러한 구조화된 함수 클래스는 상태-행동 매핑을 보행의 조각별 매끄러운 특성과 정렬하여 샘플 효율성을 향상시키고, 행동 떨림과 에너지 소비를 줄이며, 해석 가능한 자세-행동 민감도를 제공합니다. 다중 모드 지연 무작위화(MMDR)를 채택하고 Proximal Policy Optimization (PPO)로 end-to-end 학습을 수행합니다. 균일하고 불균일한 표면, 정적 또는 동적 장애물이 있는 시나리오 등 다양한 지형에서의 평가 결과, QuadKAN은 최첨단(SOTA) 기준 모델보다 일관되게 높은 수익, 더 긴 이동 거리, 그리고 더 적은 충돌을 달성함을 보여줍니다. 이러한 결과는 스플라인 매개변수화된 정책이 강건한 시각 유도 보행을 위한 간단하고 효과적이며 해석 가능한 대안임을 보여줍니다.