Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Constrained and Robust Policy Synthesis with Satisfiability-Modulo-Probabilistic-Model-Checking

Created by
  • Haebom
Category
Empty

저자

Linus Heck, Filip Macak, Milan \v{C}e\v{s}ka, Sebastian Junges

개요

유한 마르코프 결정 과정(MDP)에 대한 보상 최적 정책을 계산하는 능력은 계획, 컨트롤러 합성, 검증 등 다양한 응용 분야의 기반이 됩니다. 이 논문은 MDP의 섭동에 강건하고 표현 또는 구현 비용과 관련된 추가적인 구조적 제약 조건을 만족하는 정책을 계산하는 접근 방식을 제시합니다. 유연성을 위해 MDP 집합에 대한 1차 논리 이론으로 제약 조건을 표현하며, 효율성을 위해 만족성 솔버와 확률적 모델 체킹 알고리즘을 긴밀하게 통합합니다.

시사점, 한계점

강건하고 제약 조건이 있는 정책 합성을 효과적으로 계산하는 최초의 접근 방식 제시.
유연한 프레임워크를 통해 임의의 구조적 제약 조건을 표현 가능.
만족성 솔버와 확률적 모델 체킹 알고리즘의 긴밀한 통합으로 효율성 확보.
수백 개의 벤치마크에 대한 실험을 통해 실현 가능성 및 경쟁력 입증.
(한계점은 논문에 명시되지 않음)
👍