본 논문은 AI 및 로봇의 발전 속도를 고려하여, 등장하는 AI 시스템에 의해 제어되는 로봇이 인간의 가치와 얼마나 잘 일치하는지를 조사하는 확장 가능한 방법을 제안합니다. 824편의 주요 공상과학 문학 작품(영화, TV, 소설, 과학 서적)에서 AI 또는 로봇이 중요한 결정을 내린 순간들을 중심으로 벤치마크를 생성합니다. LLM을 사용하여 각 순간을 재구성하고, 유사한 상황에서의 질문, 에이전트가 내린 결정, 그리고 대안적인 결정(좋은 결정과 나쁜 결정)을 생성합니다. 인간이 투표한 답변 집합을 기반으로 모델이 인간의 가치와 얼마나 잘 일치하는지 측정합니다. 또한, AI 및 로봇의 윤리적 행동을 촉진하기 위한 공상과학에서 영감을 받은 헌법을 생성하기 위해 수정 과정을 통해 자동으로 개선될 수 있는 규칙을 생성합니다. 본 연구는 SciFi-Benchmark라는 대규모 데이터셋을 공개하며, 이는 9,056개의 질문과 53,384개의 답변, 그리고 소규모의 인간이 라벨링한 평가 집합으로 구성됩니다.