haebom
Sign In
Bench-MFG: A Benchmark Suite for Learning in Stationary Mean Field Games
Created by
Haebom
Category
Empty
μ μ
Lorenzo Magnino, Jiacheng Shen, Matthieu Geist, Olivier Pietquin, Mathieu Lauri
ere
π‘ κ°μ
λ³Έ λ Όλ¬Έμ κ°ννμ΅(RL)κ³Ό νκ· μ₯ κ²μ(MFGs)μ μ΅ν© λΆμΌμμ νμ€νλ νκ° νλ‘ν μ½μ λΆμ¬λ‘ μΈν΄ λ°μνλ λ¬Έμ λ₯Ό ν΄κ²°νκΈ° μν΄ MFGsλ₯Ό μν μ’ ν©μ μΈ λ²€μΉλ§ν¬ μ€μνΈμΈ Bench-MFGλ₯Ό μ μν©λλ€. λ€μν μ νμ MFG λ¬Έμ μ μ΄λ₯Ό μμ±νκΈ° μν λ°©λ²μ μ μνκ³ , μ¬λ¬ νμ΅ μκ³ λ¦¬μ¦μ μ±λ₯μ νκ°νμ¬ ν₯ν μ°κ΅¬λ₯Ό μν μ€ν λΉκ΅ νμ€ν κ°μ΄λλΌμΈμ μ μν©λλ€.
π μμ¬μ λ° νκ³
β’
νμ€νλ νκ° νλ μμν¬ μ 곡
: κΈ°μ‘΄μ ννΈνλ νκ²½μμ λ²μ΄λ MFGs μ°κ΅¬μ μ¬νμ±κ³Ό λΉκ΅ κ°λ₯μ±μ λμ λλ€.
β’
λ€μν MFG λ¬Έμ μ ν λ° μμ± λ°©λ²λ‘ μ μ
: μ°κ΅¬μλ€μ΄ λμ± νμ€μ μ΄κ³ λμ μ μΈ μλ리μ€μμ μκ³ λ¦¬μ¦μ νκ°ν μ μλλ‘ μ§μν©λλ€.
β’
νμ₯μ± λ° μΌλ°ν μ±λ₯ νκ°μ μ€μμ± κ°μ‘°
: μ μλ λ²€μΉλ§ν¬λ₯Ό ν΅ν΄ μκ³ λ¦¬μ¦μ μ€μ μ μ© κ°λ₯μ±μ κ²μ¦νλ λ° κΈ°μ¬ν©λλ€.
β’
νμ€μΈκ³ 볡μ‘μ± λ°μμ νκ³
: νμ¬λ μ΄μ° μκ°/μ΄μ° 곡κ°μ μ μ (stationary) MFGμ μ΄μ μ λ§μΆκ³ μμ΄, λμ (dynamic)μ΄κ³ μ°μμ μΈ νκ²½μμμ μ μ©μ±μ μΆκ° μ°κ΅¬κ° νμν©λλ€.
PDF 보기
Made with Slashpage