Semantically Labelled Automata for Multi-Task Reinforcement Learning with LTL Instructions

Created by

Haebom

저자

Alessandro Abate, Giuseppe De Giacomo, Mathias Jackermeier, Jan Kretinsky, Maximilian Prokop, Christoph Weinhuber

💡 개요

본 연구는 선형 시간 논리(LTL)로 명시된 다양한 작업을 수행할 수 있는 단일 정책을 학습하는 다중 작업 강화 학습(RL) 문제에 대해 다룹니다. 제안된 방법론은 LTL 공식을 자동기계로 변환하고 각 상태에 의미론적 레이블을 부여하여 효율적인 자동기계 계산, 풍부한 작업 임베딩 추출, LTL 전체 지원을 가능하게 합니다. 실험 결과, 제안된 방식은 기존 방법론이 실패하는 복잡한 명세에서도 최첨단 성능을 달성했습니다.

🔑 시사점 및 한계

•

LTL 명령을 활용한 다중 작업 RL에서 기존의 접근 방식보다 뛰어난 성능을 보이는 효율적이고 구조화된 작업 표현 방법을 제시합니다.

•

의미론적으로 레이블링된 자동기계는 복잡한 LTL 속성을 처리하고 정책을 효과적으로 컨디셔닝하는 데 기여합니다.

•

더 넓은 범위의 LTL 문법 및 더 복잡한 환경으로 확장하는 연구가 필요할 수 있습니다.

PDF 보기

Made with Slashpage