본 연구는 소비자 수요 변동, 새로운 기술 발전, 공급망 혼란에 빠르게 적응해야 하는 재구성 가능한 제조 시스템(RMS)의 동적 스케줄링을 위해 Multi-Agent Reinforcement Learning(MARL)을 적용하는 방안을 제시한다. 딥 Q 네트워크(DQN) 에이전트를 활용하여 실시간 생산 계획 및 스케줄링을 수행하며, 머신 고장 및 재구성 지연과 같은 변동 상황에 적응한다. 특히, 어텐션 메커니즘을 통한 상태 표현 향상과 우선 경험 재생, n-step 리턴, 더블 DQN, 소프트 타겟 업데이트 등의 DQN 개선 기법을 적용하여 학습 안정성과 속도를 향상시켰다. 시뮬레이션 환경에서의 실험 결과, 제안된 방법이 기존 휴리스틱 기법보다 메이크스팬 및 지연 시간을 감소시키고 기계 활용도를 높이는 데 효과적임을 확인했다.