본 논문은 강화학습(RL)에서 행동 반복을 활용하여 연속 제어 작업의 성능을 향상시키는 새로운 방법인 SDAR(Spatially Decoupled Action Repetition)을 제안합니다. 기존의 행동 반복 방법들은 모든 차원의 행동을 동일하게 취급하여 유연성이 부족한 반면, SDAR은 각 행동 차원에 대해 독립적으로 행동 또는 반복을 선택하는 폐쇄 루프 방식을 통해 더욱 유연한 반복 전략을 구현합니다. 이를 통해 행동의 지속성과 다양성 사이의 균형을 개선하고, 샘플 효율성을 높이며, 정책 성능을 향상시키고, 행동 변동성을 줄이는 효과를 얻습니다. 다양한 연속 제어 시나리오에 대한 실험을 통해 SDAR의 효과를 검증합니다.