본 논문은 일상생활에서 마주치는 1,360개의 도덕적 딜레마를 포함한 DailyDilemmas 데이터셋을 제시합니다. 각 딜레마는 두 가지 행동 방안과, 각 행동에 영향을 받는 당사자 및 관련된 인간 가치를 제시합니다. 이를 바탕으로 다양한 일상 주제(대인 관계, 직장, 환경 문제 등)를 아우르는 인간 가치 저장소를 구축하고, LLM들이 이러한 딜레마에서 어떤 행동을 선택하고, 그 행동 선택이 어떤 가치를 나타내는지 평가합니다. 세계 가치 조사, 도덕적 기반 이론, 매슬로우의 욕구 계층, 아리스토텔레스의 덕, 플루치크의 감정의 바퀴 등 5가지 이론적 틀을 사용하여 가치를 분석합니다. LLM의 가치 우선 순위가 모델 간에 상당한 차이를 보이며, OpenAI(ModelSpec)와 Anthropic(Constitutional AI)의 가이드라인이 실제 모델의 가치 우선 순위와 어떻게 일치하는지도 분석합니다. 마지막으로, 최종 사용자가 시스템 프롬프트를 사용하여 이러한 우선 순위를 효과적으로 조정할 수 없다는 점을 발견합니다.