자율 AI 시스템은 새로운 환경이나 불완전하게 정의된 환경에서 여러 가능한 행동 경로를 평가해야 합니다. 이러한 시스템은 훈련을 받았음에도 불구하고, 모든 운영 제약 조건을 완전히 충족하는 행동 경로가 없는 시나리오에 직면할 수 있습니다. 인간의 기대와 가치에 따라 목표를 달성하기 위해 에이전트는 훈련된 정책을 넘어 후보 행동 경로를 구축, 평가 및 정당화해야 합니다. 이러한 과정에는 사전 정책 훈련 범위를 벗어나는 상황적 "지식"이 필요합니다. 본 논문은 이러한 환경에서 에이전트 의사 결정에 필요한 사항을 설명하고, 에이전트의 목표에 강력하고 인간의 기대에 부합하는 결정을 내리는 데 필요한 지식 유형을 식별합니다. 분석과 실제 사례 연구를 통해, 복잡한 실제 환경에서 보다 일치된 행동 경로를 선택하고 추구하기 위해 에이전트가 규범적, 실용적, 상황적 이해를 어떻게 통합해야 하는지 조사합니다.