본 논문은 다수의 다중 용량 자율 로봇이 공간적으로 분산된 픽업 및 배달 요청을 고정된 최대 대기 시간 내에 처리해야 하는 다중 로봇 환경을 고려합니다. 요청은 미리 예약되거나 실시간으로 시스템에 들어올 수 있습니다. 이 환경에서 라우팅 정책의 안정성은 시간에 따라 정책의 비용이 균일하게 경계되는 것으로 정의됩니다. 기존 연구는 안정성을 이론적으로 유지하기 위해 오프라인으로 문제를 해결하거나, 안정성에 대한 이론적 보장을 희생하여 동적으로 도착하는 요청을 고려합니다. 본 논문에서는 실시간 수요에 적응하면서도 학습된 라우팅 정책의 안정성을 증명 가능하게 유지하는 새로운 사전 대비 롤아웃 기반 라우팅 프레임워크를 제안하여 이러한 간극을 해소하고자 합니다. 구성에 따라 안정성을 보장하는 충분히 큰 함대를 얻는 함대 규모 조정 알고리즘을 제안하여 우리 방법에 대한 증명 가능한 안정성 보장을 도출합니다. 이론적 결과를 검증하기 위해 하버드의 저녁 밴 시스템에 대한 실제 승차 요청에 대한 사례 연구를 고려합니다. 또한 현재 배포된 더 작은 함대 크기를 사용하여 프레임워크의 성능을 평가합니다. 이 더 작은 설정에서 현재 배포된 라우팅 알고리즘, 탐욕적 휴리스틱 및 몬테카를로 트리 검색 기반 알고리즘과 비교합니다. 실험 결과에 따르면 이론적 결과에서 찾은 충분히 큰 함대 크기를 사용하는 경우 프레임워크가 안정성을 유지합니다. 현재 배포된 더 작은 함대 크기의 경우, 우리 방법은 가장 가까운 기준선보다 6% 더 많은 요청을 처리하는 동시에 중앙값 승객 대기 시간을 33% 단축합니다.