Sign In

Computing the Reachability Value of Posterior-Deterministic POMDPs

Created by
  • Haebom
Category
Empty

μ €μž

Nathanael Fijalkow, Arka Ghosh, Roman Kniazev, Guillermo A. Perez, Pierre Vandenhove

πŸ’‘ κ°œμš”

이 논문은 λΆ€λΆ„ κ΄€μΈ‘ 마λ₯΄μ½”ν”„ κ²°μ • κ³Όμ •(POMDP)μ—μ„œ λͺ©ν‘œ μƒνƒœ 도달 ν™•λ₯  κ³„μ‚°μ˜ λ³΅μž‘μ„± 문제λ₯Ό λ‹€λ£Ήλ‹ˆλ‹€. 연ꡬ진은 '사후 결정적 POMDP'λΌλŠ” μƒˆλ‘œμš΄ POMDP 클래슀λ₯Ό μ œμ•ˆν•˜λ©°, 이 ν΄λž˜μŠ€μ—μ„œλŠ” μž„μ˜μ˜ μ •λ°€λ„λ‘œ λͺ©ν‘œ μƒνƒœ 도달 ν™•λ₯ μ„ 근사 계산할 수 μžˆμŒμ„ λ³΄μž…λ‹ˆλ‹€. μ΄λŠ” κΈ°μ‘΄ POMDPμ—μ„œ 도달 ν™•λ₯  계산이 μ–΄λ ΅κ±°λ‚˜ λΆˆκ°€λŠ₯ν–ˆλ˜ 것과 λŒ€λΉ„λ˜λŠ” μ€‘μš”ν•œ μ„±κ³Όμž…λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
사후 결정적 POMDPλŠ” MDPλ₯Ό ν¬ν•¨ν•˜λŠ” 비ꡐ적 넓은 클래슀둜, 이 ν΄λž˜μŠ€μ—μ„œλŠ” 도달 ν™•λ₯  계산 문제λ₯Ό 효율적으둜 ν•΄κ²°ν•  수 μžˆλŠ” κ°€λŠ₯성을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
'사후 결정적'μ΄λΌλŠ” 속성은 일단 μ‹€μ œ μƒνƒœκ°€ μ•Œλ €μ§€λ©΄ κ³„μ†ν•΄μ„œ μ•Œλ €μ§„λ‹€λŠ” 직관적이고 μžμ—°μŠ€λŸ¬μš΄ νŠΉμ„±μ„ κ°€μ§‘λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ 방법둠이 μ‹€μ œ 적용 κ°€λŠ₯ν•œ μ•Œκ³ λ¦¬μ¦˜μœΌλ‘œ 이어지기 μœ„ν•΄μ„œλŠ” 사후 결정적 POMDP의 μ •μ˜λ₯Ό λ§Œμ‘±ν•˜λŠ” 더 λ‹€μ–‘ν•œ 사둀λ₯Ό λ°œκ΅΄ν•˜κ³ , μ‹€μ œμ μΈ 근사 μ•Œκ³ λ¦¬μ¦˜μ„ κ°œλ°œν•˜λŠ” 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘