본 논문은 불확실한 활동 기간과 현금 흐름을 가진 프로젝트를 다룬다. 활동들은 선행 제약 조건을 만족하며, 현금 유입과 유출을 발생시킨다. 목표는 현금 유입을 가속화하고 유출을 지연시켜 기대 순현재가치(NPV)를 최대화하는 것이다. 문제를 이산 시간 마르코프 의사 결정 프로세스(MDP)로 공식화하고, Double Deep Q-Network (DDQN) 접근 방식을 제안한다. DDQN은 전통적인 전략보다 우수한 성능을 보이며, 특히 대규모 또는 고도로 불확실한 환경에서 계산 능력, 정책 신뢰성, 적응성 면에서 우수하다.