Bài báo này đề cập đến việc điều khiển robot bốn chân được hướng dẫn bằng thị giác bằng cách sử dụng học tăng cường (RL), nhấn mạnh sự tích hợp thiết yếu của cảm giác bản thể và thị giác để điều khiển mạnh mẽ. Chúng tôi đề xuất QuadKAN, một chính sách liên mô thức được tham số hóa theo spline sử dụng Mạng Kolmogorov-Arnold (KAN). QuadKAN tích hợp một bộ mã hóa spline cho cảm giác bản thể và một đầu hợp nhất spline cho thông tin thị giác bản thể. Lớp chức năng có cấu trúc này căn chỉnh ánh xạ trạng thái-hành động với độ mượt mà từng phần của dáng đi, cải thiện hiệu quả lấy mẫu, giảm rung lắc khi hành động và mức tiêu thụ năng lượng, đồng thời cung cấp độ nhạy tư thế-hành động có thể diễn giải được. Chúng tôi sử dụng Ngẫu nhiên hóa độ trễ đa mô thức (MMDR) và thực hiện học tập đầu cuối với Tối ưu hóa chính sách gần (PPO). Kết quả đánh giá trên nhiều địa hình khác nhau, bao gồm các bề mặt đồng đều và không bằng phẳng, cũng như các tình huống có chướng ngại vật tĩnh và động, chứng minh rằng QuadKAN luôn đạt được hiệu suất cao hơn, khoảng cách di chuyển dài hơn và ít va chạm hơn so với các mô hình cơ sở hiện đại (SOTA). Những kết quả này chứng minh rằng các chính sách tham số hóa spline là một giải pháp thay thế đơn giản, hiệu quả và dễ hiểu cho việc đi bộ có hướng dẫn thị giác mạnh mẽ.