Sign In

Scaling Strategy, Not Compute: A Stand-Alone, Open-Source StarCraft II Benchmark for Accessible Reinforcement Learning Research

Created by
  • Haebom
Category
Empty

μ €μž

Sourav Panda, Shreyash Kale, Tanmay Ambadkar, Abhinav Verma, Jonathan Dodge

πŸ’‘ κ°œμš”

λ³Έ 논문은 κΈ°μ‘΄ μŠ€νƒ€ν¬λž˜ν”„νŠΈ II κ²Œμž„ ν™˜κ²½κ³Ό λ―Έλ‹ˆκ²Œμž„ ν™˜κ²½ μ‚¬μ΄μ˜ λ³΅μž‘μ„± 격차λ₯Ό ν•΄μ†Œν•˜κΈ° μœ„ν•΄ μƒˆλ‘œμš΄ 쀑간 μˆ˜μ€€μ˜ 벀치마크인 Two-Bridge Map Suiteλ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. 경제 μ‹œμŠ€ν…œμ„ μ œκ±°ν•˜μ—¬ μž₯거리 이동 및 κ·Όμ ‘ μ „νˆ¬μ™€ 같은 핡심 μ „μˆ  λŠ₯λ ₯에 μ§‘μ€‘ν•¨μœΌλ‘œμ¨, μ—°κ΅¬μžλ“€μ€ ν˜„μ‹€μ μΈ μ»΄ν“¨νŒ… μ˜ˆμ‚°μœΌλ‘œλ„ 효율적인 κ°•ν™”ν•™μŠ΅ μ•Œκ³ λ¦¬μ¦˜ 연ꡬλ₯Ό μˆ˜ν–‰ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
κΈ°μ‘΄ μŠ€νƒ€ν¬λž˜ν”„νŠΈ II μ—°κ΅¬μ˜ ν˜„μ‹€μ μΈ μ»΄ν“¨νŒ… μ œμ•½μ„ μ™„ν™”ν•˜κ³ , 더 λ§Žμ€ μ—°κ΅¬μžλ“€μ΄ μ°Έμ—¬ν•  수 μžˆλ„λ‘ 접근성을 λ†’μ˜€μŠ΅λ‹ˆλ‹€.
β€’
쀑간 μˆ˜μ€€μ˜ 벀치마크 ν™˜κ²½μ„ μ œκ³΅ν•˜μ—¬ κ°•ν™”ν•™μŠ΅ 컀리큘럼 섀계 및 λ‹€μ–‘ν•œ μ•Œκ³ λ¦¬μ¦˜ μ‹€ν—˜μ„ μš©μ΄ν•˜κ²Œ ν•©λ‹ˆλ‹€.
β€’
λ³Έ λ²€μΉ˜λ§ˆν¬λŠ” 경제 및 기타 λ³΅μž‘ν•œ μ‹œμŠ€ν…œμ„ μ œκ±°ν•˜μ˜€μœΌλ―€λ‘œ, μ‹€μ œ μŠ€νƒ€ν¬λž˜ν”„νŠΈ II κ²Œμž„μ˜ 전체적인 λ³΅μž‘μ„±μ„ λ°˜μ˜ν•˜μ§€λŠ” λͺ»ν•©λ‹ˆλ‹€.
πŸ‘