haebom
Sign In
Scaling Strategy, Not Compute: A Stand-Alone, Open-Source StarCraft II Benchmark for Accessible Reinforcement Learning Research
Created by
Haebom
Category
Empty
μ μ
Sourav Panda, Shreyash Kale, Tanmay Ambadkar, Abhinav Verma, Jonathan Dodge
π‘ κ°μ
λ³Έ λ Όλ¬Έμ κΈ°μ‘΄ μ€νν¬λννΈ II κ²μ νκ²½κ³Ό λ―Έλκ²μ νκ²½ μ¬μ΄μ 볡μ‘μ± κ²©μ°¨λ₯Ό ν΄μνκΈ° μν΄ μλ‘μ΄ μ€κ° μμ€μ λ²€μΉλ§ν¬μΈ Two-Bridge Map Suiteλ₯Ό μ μν©λλ€. κ²½μ μμ€ν μ μ κ±°νμ¬ μ₯거리 μ΄λ λ° κ·Όμ μ ν¬μ κ°μ ν΅μ¬ μ μ λ₯λ ₯μ μ§μ€ν¨μΌλ‘μ¨, μ°κ΅¬μλ€μ νμ€μ μΈ μ»΄ν¨ν μμ°μΌλ‘λ ν¨μ¨μ μΈ κ°ννμ΅ μκ³ λ¦¬μ¦ μ°κ΅¬λ₯Ό μνν μ μμ΅λλ€.
π μμ¬μ λ° νκ³
β’
κΈ°μ‘΄ μ€νν¬λννΈ II μ°κ΅¬μ νμ€μ μΈ μ»΄ν¨ν μ μ½μ μννκ³ , λ λ§μ μ°κ΅¬μλ€μ΄ μ°Έμ¬ν μ μλλ‘ μ κ·Όμ±μ λμμ΅λλ€.
β’
μ€κ° μμ€μ λ²€μΉλ§ν¬ νκ²½μ μ 곡νμ¬ κ°ννμ΅ μ»€λ¦¬νλΌ μ€κ³ λ° λ€μν μκ³ λ¦¬μ¦ μ€νμ μ©μ΄νκ² ν©λλ€.
β’
λ³Έ λ²€μΉλ§ν¬λ κ²½μ λ° κΈ°ν 볡μ‘ν μμ€ν μ μ κ±°νμμΌλ―λ‘, μ€μ μ€νν¬λννΈ II κ²μμ μ 체μ μΈ λ³΅μ‘μ±μ λ°μνμ§λ λͺ»ν©λλ€.
PDF 보기
Made with Slashpage