haebom
Sign In
Semantically Labelled Automata for Multi-Task Reinforcement Learning with LTL Instructions
Created by
Haebom
Category
Empty
μ μ
Alessandro Abate, Giuseppe De Giacomo, Mathias Jackermeier, Jan Kret
insk
y, Maximilian Prokop, Christoph Weinhuber
π‘ κ°μ
λ³Έ μ°κ΅¬λ μ ν μκ° λ Όλ¦¬(LTL)λ‘ λͺ μλ λ€μν μμ μ μνν μ μλ λ¨μΌ μ μ± μ νμ΅νλ λ€μ€ μμ κ°ν νμ΅(RL) λ¬Έμ μ λν΄ λ€λ£Ήλλ€. μ μλ λ°©λ²λ‘ μ LTL 곡μμ μλκΈ°κ³λ‘ λ³ννκ³ κ° μνμ μλ―Έλ‘ μ λ μ΄λΈμ λΆμ¬νμ¬ ν¨μ¨μ μΈ μλκΈ°κ³ κ³μ°, νλΆν μμ μλ² λ© μΆμΆ, LTL μ 체 μ§μμ κ°λ₯νκ² ν©λλ€. μ€ν κ²°κ³Ό, μ μλ λ°©μμ κΈ°μ‘΄ λ°©λ²λ‘ μ΄ μ€ν¨νλ 볡μ‘ν λͺ μΈμμλ μ΅μ²¨λ¨ μ±λ₯μ λ¬μ±νμ΅λλ€.
π μμ¬μ λ° νκ³
β’
LTL λͺ λ Ήμ νμ©ν λ€μ€ μμ RLμμ κΈ°μ‘΄μ μ κ·Ό λ°©μλ³΄λ€ λ°μ΄λ μ±λ₯μ 보μ΄λ ν¨μ¨μ μ΄κ³ ꡬ쑰νλ μμ νν λ°©λ²μ μ μν©λλ€.
β’
μλ―Έλ‘ μ μΌλ‘ λ μ΄λΈλ§λ μλκΈ°κ³λ 볡μ‘ν LTL μμ±μ μ²λ¦¬νκ³ μ μ± μ ν¨κ³Όμ μΌλ‘ 컨λμ λνλ λ° κΈ°μ¬ν©λλ€.
β’
λ λμ λ²μμ LTL λ¬Έλ² λ° λ 볡μ‘ν νκ²½μΌλ‘ νμ₯νλ μ°κ΅¬κ° νμν μ μμ΅λλ€.
PDF 보기
Made with Slashpage