Sign In

Shields to Guarantee Probabilistic Safety in MDPs

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Linus Heck, Filip Macak, Roman Andriushchenko, Milan \v{C}e\v{s}ka, Sebastian Junges

πŸ’‘ κ°œμš”

λ³Έ 논문은 ν™•λ₯ λ‘ μ  μ•ˆμ „μ„±μ„ 보μž₯ν•˜λŠ” 자율 μ—μ΄μ „νŠΈ μ‹œμŠ€ν…œμ„ μœ„ν•œ μƒˆλ‘œμš΄ 쉴딩(shielding) ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ•ˆν•œλ‹€. 기쑴의 결정둠적 μ•ˆμ „ 보μž₯κ³ΌλŠ” 달리, ν™•λ₯ λ‘ μ  μ•ˆμ „μ„±μ€ νŠΉμ • λ‚˜μœ 사건이 ν—ˆμš© κ°€λŠ₯ν•œ ν™•λ₯ λ‘œ λ°œμƒν•  수 μžˆμŒμ„ μ˜λ―Έν•˜λ©°, 이λ₯Ό μœ„ν•œ 쉴딩 기법은 λ³΅μž‘ν•˜λ‹€. λ³Έ μ—°κ΅¬λŠ” μ΄λŸ¬ν•œ ν™•λ₯ λ‘ μ  μ•ˆμ „μ„±μ„ 보μž₯ν•˜λŠ” 쉴딩 기법을 κ°œλ°œν•˜κ³ , μ‹€ν—˜μ„ 톡해 μ‹€μ§ˆμ μΈ 이점과 계산 νš¨μœ¨μ„±μ„ μž…μ¦ν•œλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
ν™•λ₯ λ‘ μ  μ•ˆμ „μ„±μ„ 보μž₯ν•˜λŠ” 쉴딩 μ‹œμŠ€ν…œμ€ 결정둠적 μ•ˆμ „ 보μž₯κ³Ό μ΅œλŒ€ ν—ˆμš© κ°€λŠ₯μ„±(permissiveness)에 λŒ€ν•œ κ°•λ ₯ν•œ 보μž₯을 κ·ΈλŒ€λ‘œ μœ μ§€ν•˜λŠ” 것이 λΆˆκ°€λŠ₯함을 보여쀀닀.
β€’
κΈ°μ‘΄ 쉴딩 기법을 ν™•λ₯ λ‘ μ  μ•ˆμ „μ„± 보μž₯을 μœ„ν•΄ 보수적으둜 ν™•μž₯ν•˜λŠ” ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ‹œν•˜λ©°, μƒλŒ€μ μœΌλ‘œ μ•½ν•œ 보μž₯을 κ°€μ§€λŠ” μžμ—°μŠ€λŸ¬μš΄ 쉴딩 기법듀을 μ†Œκ°œν•œλ‹€.
β€’
κ°•λ ₯ν•œ μ•ˆμ „ 보μž₯을 μ œκ³΅ν•˜λŠ” μ˜€ν”„λΌμΈ 및 온라인 μ‰΄λ“œ ꡬ좕 방법을 λ„μž…ν•˜μ—¬ μ‹€μš©μ„±κ³Ό 계산 νš¨μœ¨μ„±μ„ μž…μ¦ν•œλ‹€.
πŸ‘