Nghiên cứu này nhằm mục đích cải thiện khả năng định hướng tự động và tránh chướng ngại vật của một robot bốn chân mô phỏng bằng các thuật toán học tăng cường. Cụ thể, chúng tôi tập trung vào việc phát triển mô phỏng một chú chó dẫn đường robot dành cho người khiếm thị và hy vọng sẽ đóng góp vào việc mở rộng nghiên cứu về động vật robot y tế (như chó dẫn đường và chó cảnh báo). Ba thuật toán, Tối ưu hóa Chính sách Gần (PPO), Mạng Q Sâu (DQN) và Học Q, đã được so sánh và phân tích, đồng thời được đánh giá dựa trên phát hiện va chạm, thuật toán tìm đường, sử dụng cảm biến, loại robot và nền tảng mô phỏng. Kết quả thử nghiệm trong môi trường tự tạo cho thấy thuật toán PPO vượt trội hơn hai thuật toán còn lại về số bước trung bình và trung vị cần thiết để đến được điểm đích.