Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

FairSHAP: Preprocessing for Fairness Through Attribution-Based Data Augmentation

Created by
  • Haebom

저자

Lin Zhu, Yijun Bian, Lei You

FairSHAP: Shapley Values 기반의 공정성 개선 전처리 프레임워크

개요

본 논문은 기계 학습 모델의 공정성 확보를 위해 Shapley value를 활용하는 새로운 전처리 프레임워크인 FairSHAP을 소개합니다. FairSHAP은 Shapley value 기반의 해석 가능한 특성 중요도 측정 방식을 사용하여 불공정성을 유발하는 훈련 데이터의 인스턴스를 식별하고, 민감 그룹 간 인스턴스 레벨 매칭을 통해 체계적으로 수정합니다. 이 과정은 데이터 무결성과 모델 정확도를 유지하면서 차별 위험(discriminative risk)과 같은 개별 공정성 지표를 개선합니다. FairSHAP은 다양한 표 형식 데이터셋에서 인구 통계적 동등성(demographic parity)과 기회 균등(equality of opportunity)을 크게 개선하며, 최소한의 데이터 변동으로 공정성 향상을 달성하고, 경우에 따라 예측 성능을 향상시킵니다. FairSHAP은 모델 독립적이고 투명한 방법으로, 기존 기계 학습 파이프라인에 쉽게 통합되며, 편향의 원인에 대한 실행 가능한 통찰력을 제공합니다.

시사점, 한계점

시사점:
Shapley value를 활용하여 공정성 확보를 위한 해석 가능한 전처리 프레임워크 제시.
불공정성을 유발하는 데이터 인스턴스를 식별하고 수정하여 차별 위험 감소.
인구 통계적 동등성 및 기회 균등 개선 효과 입증.
데이터 무결성 및 모델 정확도 유지.
모델 독립적이며 기존 파이프라인에 통합 용이.
편향의 원인에 대한 통찰력 제공.
한계점:
논문 내용만으로는 구체적인 데이터셋, 성능 향상 정도, 알고리즘의 복잡성 등에 대한 상세 정보 부족.
깃허브 링크만 제공되어, 실제 구현 및 적용에 필요한 정보의 접근성 한정적일 수 있음.
FairSHAP의 효과가 특정 데이터셋이나 문제 유형에 국한될 수 있음.
👍