본 논문은 불확실성 하의 순차적 의사 결정이 중요한 프로세스 시스템 공학(PSE) 분야의 문제 해결을 위해 강화 학습(RL) 방법을 소개하는 서베이 및 튜토리얼 논문이다. 가치 기반, 정책 기반, 액터-크리틱 등 RL의 기본적인 개념과 주요 알고리즘을 다루며, PSE 분야의 다양한 응용 사례를 제시한다. 또한, PSE에 특화된 기술과 새로운 연구 방향을 논의하며, RL 알고리즘 개발 현황과 PSE에 대한 함의를 종합하여 성공, 과제, 트렌드를 파악하고 향후 연구 방향을 제시한다.