Sign In

Graph-Enhanced Deep Reinforcement Learning for Multi-Objective Unrelated Parallel Machine Scheduling

Created by
  • Haebom
Category
Empty

μ €μž

Bulent Soykan, Sean Mondesire, Ghaith Rabadi, Grace Bochenek

πŸ’‘ κ°œμš”

λ³Έ 논문은 μž‘μ—…, 기계, μ…‹μ—…μ˜ λ³΅μž‘ν•œ μ œμ•½ 쑰건을 ν¬ν•¨ν•˜λŠ” λ‹€λͺ©μ  κ΄€λ ¨ μ—†λŠ” 병렬 기계 μŠ€μΌ€μ€„λ§ 문제(UPMSP)λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄ κ·Έλž˜ν”„ 신경망(GNN)κ³Ό κ·Όμ ‘ μ •μ±… μ΅œμ ν™”(PPO)λ₯Ό κ²°ν•©ν•œ λ”₯ κ°•ν™” ν•™μŠ΅ ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. μ œμ•ˆλœ GNN-PPO μ—μ΄μ „νŠΈλŠ” 총 κ°€μ€‘μΉ˜ μ§€μ—° μ‹œκ°„(TWT)κ³Ό 총 μ…‹μ—… μ‹œκ°„(TST)을 λ™μ‹œμ— μ΅œμ†Œν™”ν•˜λŠ” μŠ€μΌ€μ€„λ§ 정책을 직접 ν•™μŠ΅ν•©λ‹ˆλ‹€. μ‹€ν—˜ κ²°κ³Ό, 이 μ ‘κ·Ό 방식은 κΈ°μ‘΄ 방법둠에 λΉ„ν•΄ 두 κ°€μ§€ λͺ©μ  λͺ¨λ‘μ—μ„œ μš°μˆ˜ν•œ μ ˆμΆ©μ μ„ λ‹¬μ„±ν•˜μ—¬ 제쑰 μŠ€μΌ€μ€„λ§ λΆ„μ•Όμ—μ„œ κ°•λ ₯ν•˜κ³  ν™•μž₯ κ°€λŠ₯ν•œ μ†”λ£¨μ…˜μ„ μ œκ³΅ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
GNN을 ν™œμš©ν•˜μ—¬ UPMSP 문제의 λ³΅μž‘ν•œ μƒνƒœ 정보λ₯Ό 효과적으둜 ν‘œν˜„ν•¨μœΌλ‘œμ¨ λ”₯ κ°•ν™” ν•™μŠ΅ μ—μ΄μ „νŠΈμ˜ μ„±λŠ₯을 ν–₯μƒμ‹œν‚¬ 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
λ‹€λͺ©μ  보상 ν•¨μˆ˜λ₯Ό 톡해 TWT와 TSTλ₯Ό λ™μ‹œμ— μ΅œμ ν™”ν•˜λŠ” 직접적인 μŠ€μΌ€μ€„λ§ μ •μ±… ν•™μŠ΅μ΄ κ°€λŠ₯함을 λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
λŒ€κ·œλͺ¨ 및 λ³΅μž‘ν•œ 제쑰 μŠ€μΌ€μ€„λ§ λ¬Έμ œμ— λŒ€ν•œ κ°•λ ₯ν•˜κ³  ν™•μž₯ κ°€λŠ₯ν•œ 해결책을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
νŠΉμ • GNN ꡬ쑰 및 PPO νŒŒλΌλ―Έν„°μ— λŒ€ν•œ 민감도 뢄석 λ˜λŠ” λ‹€μ–‘ν•œ 벀치마크 μΈμŠ€ν„΄μŠ€μ— λŒ€ν•œ 좔가적인 μΌλ°˜ν™” μ„±λŠ₯ 검증이 ν•„μš”ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘