Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

An approach of deep reinforcement learning for maximizing the net present value of stochastic projects

Created by
  • Haebom
Category
Empty

저자

Wei Xu, Fan Yang, Qinyuan Cui, Zhi Chen

개요

본 논문은 불확실한 활동 기간과 현금 흐름을 가진 프로젝트를 다룬다. 활동들은 선행 제약 조건을 만족하며, 현금 유입과 유출을 발생시킨다. 목표는 현금 유입을 가속화하고 유출을 지연시켜 기대 순현재가치(NPV)를 최대화하는 것이다. 문제를 이산 시간 마르코프 의사 결정 프로세스(MDP)로 공식화하고, Double Deep Q-Network (DDQN) 접근 방식을 제안한다. DDQN은 전통적인 전략보다 우수한 성능을 보이며, 특히 대규모 또는 고도로 불확실한 환경에서 계산 능력, 정책 신뢰성, 적응성 면에서 우수하다.

시사점, 한계점

DDQN은 복잡한 프로젝트 최적화에서 더 높은 기대 NPV를 달성한다.
DDQN은 안정적이고 효과적인 정책 구현을 위한 신뢰할 수 있는 프레임워크를 제공한다.
듀얼 네트워크 아키텍처는 액션 가치 과대평가를 완화한다.
타겟 네트워크는 훈련 수렴과 견고성을 향상시킨다.
논문의 한계점은 명시적으로 언급되지 않음.
👍