Sign In

From Imitation to Interaction: Mastering Game of Schnapsen with Shallow Reinforcement Learning

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Jan Kla\v{c}an, Sizhong Zhang

πŸ’‘ κ°œμš”

λ³Έ 논문은 얕은 신경망 기반 κ°•ν™”ν•™μŠ΅ μ—μ΄μ „νŠΈκ°€ μΉ΄λ“œ κ²Œμž„μΈ Schnapsen을 λ§ˆμŠ€ν„°ν•˜κ³  κ°•λ ₯ν•œ 검색 기반 baseline인 RdeepBot에 도전할 수 μžˆλŠ”μ§€ νƒκ΅¬ν•©λ‹ˆλ‹€. 지도 ν•™μŠ΅ μ—μ΄μ „νŠΈ(MLPBot)λŠ” μž¬ν˜„ λ°μ΄ν„°λ‘œ ν›ˆλ ¨λ˜μ—ˆμœΌλ‚˜ RdeepBot μƒλŒ€μ—κ²Œ νš¨κ³Όμ μ΄μ§€ λͺ»ν–ˆμ§€λ§Œ, κ°•ν™”ν•™μŠ΅ μ—μ΄μ „νŠΈ(RLBot)λŠ” 더 λ‚˜μ€ μ„±λŠ₯을 λ³΄μ—¬μ£Όμ—ˆμŠ΅λ‹ˆλ‹€. 특히, RLBot은 ν•™μŠ΅λœ κ°€μΉ˜ ν•¨μˆ˜λ₯Ό κΉŠμ€ 탐색과 κ²°ν•©ν–ˆμ„ λ•Œ RdeepBot λŒ€λΉ„ ν†΅κ³„μ μœΌλ‘œ μœ μ˜λ―Έν•˜κ²Œ 높은 승λ₯ μ„ λ‹¬μ„±ν–ˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
얕은 신경망 기반 κ°•ν™”ν•™μŠ΅μ€ κ°•λ ₯ν•œ 탐색 기반 κ²Œμž„ AI에 λŒ€ν•­ν•  수 μžˆλŠ” 잠재λ ₯을 κ°€μ§€κ³  μžˆμŠ΅λ‹ˆλ‹€.
β€’
지도 ν•™μŠ΅ 방식은 λ³΅μž‘ν•œ κ²Œμž„ ν™˜κ²½μ—μ„œ μΌλ°˜ν™” μ„±λŠ₯이 λ–¨μ–΄μ§€μ§€λ§Œ, κ°•ν™”ν•™μŠ΅μ€ 더 κ°•κ±΄ν•œ μ—μ΄μ „νŠΈλ₯Ό μƒμ„±ν•©λ‹ˆλ‹€.
β€’
ν›ˆλ ¨ μƒ˜ν”Œ μˆ˜μ— λ”°λ₯Έ μ„±λŠ₯ ν–₯상이 μ„ ν˜•μ μ΄μ§€ μ•Šκ³  νŠΉμ • μ§€μ μ—μ„œ 졜적의 μ„±λŠ₯을 λ³΄μ΄λŠ” λ“±, κ°•ν™”ν•™μŠ΅μ˜ μƒ˜ν”Œ νš¨μœ¨μ„± 및 μˆ˜λ ΄μ„±μ— λŒ€ν•œ 좔가적인 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘