본 논문은 안전하고 윤리적인 AI 개발에 필수적인 가치 학습 문제를 다룬다. 기존의 가치 학습은 인간 행동으로부터 가치를 추론하는 데 초점을 맞추지만, 인간의 가치는 행동으로 드러나는 것보다 훨씬 복잡하고 방대하다. 따라서 AI는 제한된 표본으로부터 인간의 가치를 일반화해야 하는 '가치 일반화 문제'에 직면한다. 본 논문은 인간의 가치가 생성적이고 합리적인 구조를 가지며, 이를 통해 가치 일반화 문제를 해결할 수 있다고 주장한다. 특히, 베이지안 이론 모델을 이용하여 행동뿐 아니라 다른 가치들로부터 인간의 가치를 추론할 수 있다는 점을 제시한다. 단순한 효용 함수로 인간의 가치를 표현하는 기존 방식의 한계를 지적하며, 생성적 가치-가치 추론 개발이 확장 가능한 기계적 마음 이론 구축에 중요하다고 결론짓는다.