본 논문은 기계 학습 모델의 공정성 확보를 위해 Shapley value를 활용하는 새로운 전처리 프레임워크인 FairSHAP을 소개합니다. FairSHAP은 Shapley value 기반의 해석 가능한 특성 중요도 측정 방식을 사용하여 불공정성을 유발하는 훈련 데이터의 인스턴스를 식별하고, 민감 그룹 간 인스턴스 레벨 매칭을 통해 체계적으로 수정합니다. 이 과정은 데이터 무결성과 모델 정확도를 유지하면서 차별 위험(discriminative risk)과 같은 개별 공정성 지표를 개선합니다. FairSHAP은 다양한 표 형식 데이터셋에서 인구 통계적 동등성(demographic parity)과 기회 균등(equality of opportunity)을 크게 개선하며, 최소한의 데이터 변동으로 공정성 향상을 달성하고, 경우에 따라 예측 성능을 향상시킵니다. FairSHAP은 모델 독립적이고 투명한 방법으로, 기존 기계 학습 파이프라인에 쉽게 통합되며, 편향의 원인에 대한 실행 가능한 통찰력을 제공합니다.