Sign In

Neural Policy Composition from Free Energy Minimization

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Francesca Rossi, Veronica Centorrino, Francesco Bullo, Giovanni Russo

πŸ’‘ κ°œμš”

이 μ—°κ΅¬λŠ” μžμ—° μ§€λŠ₯의 νŠΉμ§•μΈ μœ μ—°ν•œ 행동 ꡬ성을 인곡지λŠ₯μ—μ„œ κ΅¬ν˜„ν•˜κΈ° μœ„ν•΄, λ³€λΆ„ 자유 μ—λ„ˆμ§€ μ΅œμ†Œν™”λΌλŠ” κ·œλ²”μ  λͺ©ν‘œλ₯Ό 톡해 μ •μ±… μ‘°ν•© λ©”μ»€λ‹ˆμ¦˜μ„ μ œμ•ˆν•©λ‹ˆλ‹€. μ œμ•ˆλœ ν”„λ ˆμž„μ›Œν¬λŠ” 졜적의 μ •μ±… μ‘°ν•©μœΌλ‘œ μˆ˜λ ΄ν•˜λŠ” 연속 μ‹œκ°„ κ·Έλž˜λ””μ–ΈνŠΈ 흐름을 λ„μΆœν•˜λ©°, μ΄λŠ” μ†Œν”„νŠΈ 경쟁적 μˆœν™˜ 회둜 μ‹ κ²½λ§μœΌλ‘œ κ΅¬ν˜„λ  수 μžˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
μžμ—° μ§€λŠ₯의 행동 ꡬ성 원리λ₯Ό λ³€λΆ„ 자유 μ—λ„ˆμ§€ μ΅œμ†Œν™”λΌλŠ” ν†΅μΌλœ ν‹€ μ•ˆμ—μ„œ μ„€λͺ…ν•©λ‹ˆλ‹€.
β€’
μ •μ±… 쑰합을 μœ„ν•œ 일반적이고 원칙적인 신경망 κ΅¬ν˜„ 방법을 μ œμ‹œν•˜λ©°, λ‹€μ–‘ν•œ κ³Όμ œμ—μ„œ μš°μˆ˜ν•œ μ„±λŠ₯κ³Ό 해석 κ°€λŠ₯성을 λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ λͺ¨λΈμ˜ ν•™μŠ΅ νš¨μœ¨μ„±μ΄λ‚˜ λ³΅μž‘ν•œ ν™˜κ²½μ—μ„œμ˜ ν™•μž₯성에 λŒ€ν•œ μΆ”κ°€ 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘