Sign In

Group-Aware Coordination Graph for Multi-Agent Reinforcement Learning

Created by
  • Haebom
Category
Empty

μ €μž

Wei Duan, Jie Lu, Junyu Xuan

πŸ’‘ κ°œμš”

λ³Έ 논문은 닀쀑 μ—μ΄μ „νŠΈ κ°•ν™”ν•™μŠ΅μ—μ„œ μ—μ΄μ „νŠΈ κ°„μ˜ ν˜‘λ ₯을 ν•™μŠ΅ν•˜κΈ° μœ„ν•œ μƒˆλ‘œμš΄ μ ‘κ·Ό 방식인 Group-Aware Coordination Graph (GACG)λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. GACGλŠ” κ°œλ³„ μ—μ΄μ „νŠΈ 쌍의 ν˜‘λ ₯ κ΄€κ³„λΏλ§Œ μ•„λ‹ˆλΌ, μž₯기적인 행동 νŒ¨ν„΄μ„ 기반으둜 ν•œ κ·Έλ£Ή μˆ˜μ€€μ˜ μ˜μ‘΄μ„±κΉŒμ§€ ν¬μ°©ν•©λ‹ˆλ‹€. μ œμ•ˆλœ 방법은 이λ₯Ό 톡해 λΆ€λΆ„μ μœΌλ‘œ κ΄€μ°°λ˜λŠ” μ—μ΄μ „νŠΈ κ°„μ˜ 정보 κ΅ν™˜μ„ κ°œμ„ ν•˜λ©°, StarCraft II λ§ˆμ΄ν¬λ‘œλ§€λ‹ˆμ§€λ¨ΌνŠΈ κ³Όμ œμ—μ„œ λ›°μ–΄λ‚œ μ„±λŠ₯을 μž…μ¦ν–ˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
κΈ°μ‘΄ μ—μ΄μ „νŠΈ 쌍 관계 μ€‘μ‹¬μ˜ κ·Έλž˜ν”„ ν•™μŠ΅ ν•œκ³„λ₯Ό λ„˜μ–΄, κ·Έλ£Ή μˆ˜μ€€μ˜ μƒν˜Έ μ˜μ‘΄μ„±κΉŒμ§€ κ³ λ €ν•˜μ—¬ ν˜‘λ ₯ ν•™μŠ΅μ˜ νš¨μœ¨μ„±μ„ λ†’μ˜€μŠ΅λ‹ˆλ‹€.
β€’
κ·Έλž˜ν”„ μ»¨λ³Όλ£¨μ…˜κ³Ό κ·Έλ£Ή 거리 손싀 ν•¨μˆ˜λ₯Ό 톡해 μ—μ΄μ „νŠΈ κ°„μ˜ 효과적인 정보 κ΅ν™˜ 및 κ·Έλ£Ή λ‚΄ 행동 일관성을 κ°•ν™”ν–ˆμŠ΅λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ GACG 방법둠은 λ‹€μ–‘ν•œ MARL ν™˜κ²½μ—μ„œ λ³΅μž‘ν•œ ν˜‘λ ₯ μ „λž΅ ν•™μŠ΅μ— 적용될 수 μžˆλŠ” 잠재λ ₯을 λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
λ³Έ μ—°κ΅¬μ˜ ν•œκ³„μ μ€ λ‹€λ₯Έ MARL ν™˜κ²½μ—μ„œμ˜ μΌλ°˜ν™” μ„±λŠ₯ 검증 및 κ·Έλ£Ή ν˜•μ„± λ©”μ»€λ‹ˆμ¦˜μ˜ κ°œμ„  κ°€λŠ₯성에 λŒ€ν•œ μΆ”κ°€ 연ꡬ가 ν•„μš”ν•˜λ‹€λŠ” μ μž…λ‹ˆλ‹€.
πŸ‘