Sign In

Bench-MFG: A Benchmark Suite for Learning in Stationary Mean Field Games

Created by
  • Haebom
Category
Empty

μ €μž

Lorenzo Magnino, Jiacheng Shen, Matthieu Geist, Olivier Pietquin, Mathieu Lauriere

πŸ’‘ κ°œμš”

λ³Έ 논문은 κ°•ν™”ν•™μŠ΅(RL)κ³Ό 평균μž₯ κ²Œμž„(MFGs)의 μœ΅ν•© λΆ„μ•Όμ—μ„œ ν‘œμ€€ν™”λœ 평가 ν”„λ‘œν† μ½œμ˜ λΆ€μž¬λ‘œ 인해 λ°œμƒν•˜λŠ” 문제λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄ MFGsλ₯Ό μœ„ν•œ 쒅합적인 벀치마크 μŠ€μœ„νŠΈμΈ Bench-MFGλ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. λ‹€μ–‘ν•œ μœ ν˜•μ˜ MFG λ¬Έμ œμ™€ 이λ₯Ό μƒμ„±ν•˜κΈ° μœ„ν•œ 방법을 μ œμ‹œν•˜κ³ , μ—¬λŸ¬ ν•™μŠ΅ μ•Œκ³ λ¦¬μ¦˜μ˜ μ„±λŠ₯을 ν‰κ°€ν•˜μ—¬ ν–₯ν›„ 연ꡬλ₯Ό μœ„ν•œ μ‹€ν—˜ 비ꡐ ν‘œμ€€ν™” κ°€μ΄λ“œλΌμΈμ„ μ œμ‹œν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
ν‘œμ€€ν™”λœ 평가 ν”„λ ˆμž„μ›Œν¬ 제곡: 기쑴의 νŒŒνŽΈν™”λœ ν™˜κ²½μ—μ„œ λ²—μ–΄λ‚˜ MFGs μ—°κ΅¬μ˜ μž¬ν˜„μ„±κ³Ό 비ꡐ κ°€λŠ₯성을 λ†’μž…λ‹ˆλ‹€.
β€’
λ‹€μ–‘ν•œ MFG 문제 μœ ν˜• 및 생성 방법둠 μ œμ‹œ: μ—°κ΅¬μžλ“€μ΄ λ”μš± ν˜„μ‹€μ μ΄κ³  도전적인 μ‹œλ‚˜λ¦¬μ˜€μ—μ„œ μ•Œκ³ λ¦¬μ¦˜μ„ 평가할 수 μžˆλ„λ‘ μ§€μ›ν•©λ‹ˆλ‹€.
β€’
ν™•μž₯μ„± 및 μΌλ°˜ν™” μ„±λŠ₯ ν‰κ°€μ˜ μ€‘μš”μ„± κ°•μ‘°: μ œμ•ˆλœ 벀치마크λ₯Ό 톡해 μ•Œκ³ λ¦¬μ¦˜μ˜ μ‹€μ œ 적용 κ°€λŠ₯성을 κ²€μ¦ν•˜λŠ” 데 κΈ°μ—¬ν•©λ‹ˆλ‹€.
β€’
ν˜„μ‹€μ„Έκ³„ λ³΅μž‘μ„± 반영의 ν•œκ³„: ν˜„μž¬λŠ” 이산 μ‹œκ°„/이산 κ³΅κ°„μ˜ 정적(stationary) MFG에 μ΄ˆμ μ„ λ§žμΆ”κ³  μžˆμ–΄, 동적(dynamic)이고 연속적인 ν™˜κ²½μ—μ„œμ˜ μ μš©μ„±μ€ μΆ”κ°€ 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘