본 논문은 인간의 의사결정에서 관찰된 결과와 바람직한 결과 간의 차이를 설명 가능한 방식으로 모델링하는 공정한 기계 학습 알고리즘을 제안합니다. 바람직한 결과는 인간의 의사결정에 영향을 받는 하류 결과의 불균형을 줄이는 것을 목표로 합니다. 기존 연구는 의사결정 과정에서 결과를 고려하지 않고 공정한 표현을 학습하는 데 초점을 맞췄습니다. 본 논문에서는 결과의 불균형이 관찰된 의사결정자와 바람직한 의사결정자가 입력을 다르게 표현하기 때문에 발생한다고 보고, 이를 표상적 불균형이라고 정의합니다. 목표는 하류 결과의 불균형을 완화하기 위해 인간의 의사결정에 특정 개입(nudges)을 통해 수정할 수 있는 설명 가능한 표상적 불균형을 학습하는 것입니다. 이를 신경망을 사용한 다목적 최적화 문제로 구성합니다. 합리적인 단순화 가정 하에서, 제안된 신경망 모델이 결과의 불균형을 완전히 완화하는 설명 가능한 가중치를 학습한다는 것을 증명합니다. 실제 독일 신용 데이터, 성인 데이터, 헤리티지 건강 데이터를 사용하여 목표를 검증하고 결과를 해석합니다.