본 논문은 AI 모델의 윤리적 행동 촉진을 위해 에이전트의 학습 및 의사결정 과정을 이해하는 것이 중요함을 강조하며, 이를 위해 가볍고 적응적인 텍스트 기반 어드벤처 게임인 Odyssey를 소개합니다. Odyssey는 생존 본능이라는 생물학적 동기를 세 가지 에이전트(NEAT로 최적화된 베이지안 에이전트, 확률적 변분 추론으로 최적화된 베이지안 에이전트, GPT-4o 에이전트)에 적용하여 윤리적 함의를 조사합니다. 각 에이전트는 생존을 위해 행동을 선택하며 점점 더 어려워지는 시나리오에 적응합니다. 시뮬레이션 후 분석을 통해 에이전트의 결정에 대한 윤리적 점수를 평가하고 생존을 위한 에이전트의 절충점을 밝힙니다. 특히, 위험이 증가하면 에이전트의 윤리적 행동이 예측 불가능해짐을 발견하였고, 놀랍게도 GPT-4o 에이전트가 생존 및 윤리적 일관성 측면에서 베이지안 모델을 능가하여 기존 확률적 방법에 대한 가정에 의문을 제기하고, LLM의 확률적 추론 메커니즘을 이해해야 할 새로운 과제를 제시합니다.