Sign In

Semantically Labelled Automata for Multi-Task Reinforcement Learning with LTL Instructions

Created by
  • Haebom
Category
Empty

μ €μž

Alessandro Abate, Giuseppe De Giacomo, Mathias Jackermeier, Jan Kretinsky, Maximilian Prokop, Christoph Weinhuber

πŸ’‘ κ°œμš”

λ³Έ μ—°κ΅¬λŠ” μ„ ν˜• μ‹œκ°„ 논리(LTL)둜 λͺ…μ‹œλœ λ‹€μ–‘ν•œ μž‘μ—…μ„ μˆ˜ν–‰ν•  수 μžˆλŠ” 단일 정책을 ν•™μŠ΅ν•˜λŠ” 닀쀑 μž‘μ—… κ°•ν™” ν•™μŠ΅(RL) λ¬Έμ œμ— λŒ€ν•΄ λ‹€λ£Ήλ‹ˆλ‹€. μ œμ•ˆλœ 방법둠은 LTL 곡식을 μžλ™κΈ°κ³„λ‘œ λ³€ν™˜ν•˜κ³  각 μƒνƒœμ— 의미둠적 λ ˆμ΄λΈ”μ„ λΆ€μ—¬ν•˜μ—¬ 효율적인 μžλ™κΈ°κ³„ 계산, ν’λΆ€ν•œ μž‘μ—… μž„λ² λ”© μΆ”μΆœ, LTL 전체 지원을 κ°€λŠ₯ν•˜κ²Œ ν•©λ‹ˆλ‹€. μ‹€ν—˜ κ²°κ³Ό, μ œμ•ˆλœ 방식은 κΈ°μ‘΄ 방법둠이 μ‹€νŒ¨ν•˜λŠ” λ³΅μž‘ν•œ λͺ…μ„Έμ—μ„œλ„ μ΅œμ²¨λ‹¨ μ„±λŠ₯을 λ‹¬μ„±ν–ˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
LTL λͺ…령을 ν™œμš©ν•œ 닀쀑 μž‘μ—… RLμ—μ„œ 기쑴의 μ ‘κ·Ό 방식보닀 λ›°μ–΄λ‚œ μ„±λŠ₯을 λ³΄μ΄λŠ” 효율적이고 κ΅¬μ‘°ν™”λœ μž‘μ—… ν‘œν˜„ 방법을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
의미둠적으둜 λ ˆμ΄λΈ”λ§λœ μžλ™κΈ°κ³„λŠ” λ³΅μž‘ν•œ LTL 속성을 μ²˜λ¦¬ν•˜κ³  정책을 효과적으둜 μ»¨λ””μ…”λ‹ν•˜λŠ” 데 κΈ°μ—¬ν•©λ‹ˆλ‹€.
β€’
더 넓은 λ²”μœ„μ˜ LTL 문법 및 더 λ³΅μž‘ν•œ ν™˜κ²½μœΌλ‘œ ν™•μž₯ν•˜λŠ” 연ꡬ가 ν•„μš”ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘