본 논문은 능동 입자들의 대규모 시스템 조작에 대한 연구로, 특히 군중 관리, 로봇 군집 제어, 물질 수송 등 다양한 분야에서 직면하는 어려움을 해결하고자 한다. 기존 방법론의 확장성 및 견고성 부족 문제를 해결하기 위해, 강화 학습(RL)과 인공 힘을 결합한 리더 기반의 효과적인 제어 전략을 개발한다. 이 연구에서는 일반화된 Vicsek 모델을 도입하여 리더가 능동 입자를 유도하는 방식을 설명하며, 이를 로봇 구조자(리더)를 통한 대규모 인원 대피 문제에 적용한다. 연구 결과, RL만 단독으로 사용했을 때의 비효율성을 극복하고 견고하고 효율적인 대피 전략을 제시한다.