# Multi-Objective Constraint Inference using Inverse reinforcement learning

### 저자

Syed Ihtesham Hussain Shah, Floris den Hengst, Aneta Lisowska, Annette ten Teije

### 💡 개요

본 논문은 단일 전문가 또는 동일한 목표를 가진 여러 전문가의 동질적인 시연에 의존하는 기존 제약 조건 추론 방법의 한계를 극복하기 위해 다중 목표 제약 조건 추론(MOCI) 프레임워크를 제안합니다. MOCI는 서로 다른 목표를 추구하는 여러 전문가의 이질적인 궤적에서 공유 제약 조건과 개별 선호도를 공동으로 추출하여 다양한 행동을 효과적으로 모델링하고 학습합니다. 이를 통해 기존 방법론 대비 뛰어난 예측 성능과 경쟁력 있는 계산 효율성을 달성합니다.

### 🔑 시사점 및 한계

- 이질적인 전문가 시연에서 공유 제약 조건과 개별 선호도를 효과적으로 분리하여 학습할 수 있습니다.

- 기존 방법론 대비 정확성, 유연성, 계산 효율성을 향상시켜 실제 제약 조건 추론 및 선호도 학습에 적용 가능합니다.

- 다양한 전문가 목표로 인한 잠재적 충돌 행동을 효과적으로 처리할 수 있는 프레임워크를 제공합니다.

- 복잡하거나 고차원적인 환경에서의 성능 및 확장성에 대한 추가적인 연구가 필요합니다.

---

[PDF 보기](https://arxiv.org/pdf/2605.06951)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).
