The Constitutional Controller: Doubt-Calibrated Steering of Compliant Agents
Created by
Haebom
저자
Simon Kohaut, Felix Divo, Navid Hamid, Benedict Flade, Julian Eggert, Devendra Singh Dhami, Kristian Kersting
개요
본 논문은 불확실한 환경에서 자율 에이전트의 안정적이고 규칙 준수적인 행동을 보장하는 문제를 다룬다. 신경 기호 시스템(neuro-symbolic systems)을 이용하여 확률적이고 기호적인 화이트박스 추론 모델과 딥러닝 방법을 통합함으로써 이 문제에 대한 강력한 해결책을 제시한다. 이는 명시적인 규칙과 노이즈가 있는 데이터로 훈련된 신경망 모델을 동시에 고려하여 구조적 추론의 강점과 유연한 표현의 장점을 결합한다. 이를 위해, 공유 교통 공간과 같은 제약 조건을 나타내는 심층 확률 논리 프로그램을 통해 에이전트의 안전성과 신뢰성을 향상시키도록 설계된 새로운 프레임워크인 Constitutional Controller (CoCo)를 소개한다. 또한, 이동 속도, 사용 센서 또는 건강 상태와 같은 의심 특징을 조건으로 하는 확률 밀도로 구현된 자기 의심(self-doubt) 개념을 제안한다. 실제 항공 이동성 연구를 통해 CoCo가 지능형 자율 시스템이 적절한 의심을 배우고 복잡하고 불확실한 환경을 안전하고 규칙적으로 탐색하는 데 유리함을 보여준다.