Graph-Enhanced Deep Reinforcement Learning for Multi-Objective Unrelated Parallel Machine Scheduling

Created by

Haebom

저자

Bulent Soykan, Sean Mondesire, Ghaith Rabadi, Grace Bochenek

💡 개요

본 논문은 작업, 기계, 셋업의 복잡한 제약 조건을 포함하는 다목적 관련 없는 병렬 기계 스케줄링 문제(UPMSP)를 해결하기 위해 그래프 신경망(GNN)과 근접 정책 최적화(PPO)를 결합한 딥 강화 학습 프레임워크를 제안합니다. 제안된 GNN-PPO 에이전트는 총 가중치 지연 시간(TWT)과 총 셋업 시간(TST)을 동시에 최소화하는 스케줄링 정책을 직접 학습합니다. 실험 결과, 이 접근 방식은 기존 방법론에 비해 두 가지 목적 모두에서 우수한 절충점을 달성하여 제조 스케줄링 분야에서 강력하고 확장 가능한 솔루션을 제공합니다.

🔑 시사점 및 한계

•

GNN을 활용하여 UPMSP 문제의 복잡한 상태 정보를 효과적으로 표현함으로써 딥 강화 학습 에이전트의 성능을 향상시킬 수 있습니다.

•

다목적 보상 함수를 통해 TWT와 TST를 동시에 최적화하는 직접적인 스케줄링 정책 학습이 가능함을 보여줍니다.

•

대규모 및 복잡한 제조 스케줄링 문제에 대한 강력하고 확장 가능한 해결책을 제시합니다.

•

특정 GNN 구조 및 PPO 파라미터에 대한 민감도 분석 또는 다양한 벤치마크 인스턴스에 대한 추가적인 일반화 성능 검증이 필요할 수 있습니다.

PDF 보기

Made with Slashpage