본 논문은 경험적 인간-AI 정렬(Empirical human-AI alignment)의 한계점을 지적하고 대안을 제시하는 내용을 담고 있습니다. 경험적 정렬은 AI 시스템이 관찰된 인간 행동과 일치하도록 만드는 것을 목표로 하지만, 통계적 편향을 도입할 수 있다는 점을 강조합니다. 따라서, 단순한 경험적 정렬에 반대하며, 원칙에 기반한 정렬(Prescriptive alignment)과 사후 경험적 정렬(A posteriori empirical alignment)을 대안으로 제시합니다. 언어 모델의 인간 중심적 디코딩과 같은 구체적인 예시를 통해 주장을 뒷받침합니다.