본 논문은 시카고의 음식점 위생 검사를 사례 연구로 삼아, 서비스 검사의 영향을 극대화하기 위해 지능적으로 검사 일정을 계획하는 문제를 다룬다. 시카고 공중 보건부(CDPH)의 음식점 검사 데이터와 RMAB(Restless Multi-Armed Bandit) 접근법을 활용하여, 검사 일정의 제약 조건을 해결하고 최적화하는 새로운 방법을 개발한다. Whittle index 기반 시스템을 확장하여 RMAB의 액션 윈도우 제약 조건과 빈도를 보장하고, 액션 윈도우 할당을 최적화한다. MDP 재구성 및 정수 프로그래밍 기반 룩어헤드를 결합하여 제약 조건 내에서 검사의 영향을 극대화하며, 딥러닝 기반 모델을 활용하여 실제 시카고 음식점의 상태 변화를 모델링한다.