본 논문은 Soft Actor-Critic (SAC) 기반의 심층 강화 학습 프레임워크를 제시하여, Double-Ackermann-steering mobile robots (DASMRs)의 안전하고 정확한 기동을 가능하게 한다. 홀로노믹 로봇이나 차동 구동 로봇과 달리 DASMR은 복잡한 운동학적 제약으로 인해 고전적인 플래너가 혼잡한 환경에서 취약하다. 본 프레임워크는 Hindsight Experience Replay (HER)와 CrossQ overlay를 활용하여 장애물을 회피하면서 기동 효율성을 높인다. 네 바퀴 조향 로봇을 사용한 시뮬레이션 결과, 학습된 정책이 장애물을 회피하면서 목표 위치의 최대 97%에 도달하는 것으로 나타났다. 본 프레임워크는 사전에 정의된 궤적이나 전문가의 시연에 의존하지 않는다.