Multi-Output Distributional Fairness via Post-Processing
Created by
Haebom
Category
Empty
저자
Gang Li, Qihang Lin, Ayush Ghosh, Tianbao Yang
개요
본 논문은 다중 출력 모델(다중 작업/다중 클래스 분류 및 표현 학습 등)의 분포적 공평성(distributional parity)을 향상시키기 위한 후처리 방법을 제안합니다. 기존의 후처리 방법들은 특정 작업에 대한 공평성 측정에 초점을 맞추고 단일 출력 모델에만 적용 가능하다는 한계가 있습니다. 본 논문에서는 분포적 공평성을 달성하기 위해 최적 수송 매핑(optimal transport mappings)을 사용하여 다양한 그룹의 모델 출력을 경험적 Wasserstein 중심(empirical Wasserstein barycenter)으로 이동시키는 방법을 제시합니다. 정확한 중심을 계산하는 복잡성을 줄이기 위한 근사 기법과 샘플 외 데이터에 대한 확장을 위한 커널 회귀 방법을 제안합니다. 다중 작업/다중 클래스 분류 및 표현 학습 작업에 대한 실험적 연구를 통해 제안된 방법의 효과를 다양한 기준과 비교하여 검증합니다.
시사점, 한계점
•
시사점:
◦
다중 출력 모델의 분포적 공평성 향상을 위한 효과적인 후처리 방법을 제시합니다.
◦
최적 수송 매핑을 활용하여 기존 단일 출력 모델에 국한된 방법의 한계를 극복합니다.
◦
다중 작업/다중 클래스 분류 및 표현 학습 등 다양한 작업에 적용 가능성을 보여줍니다.
◦
근사 기법 및 커널 회귀를 통해 계산 복잡도를 줄이고 샘플 외 데이터 처리를 가능하게 합니다.
•
한계점:
◦
제안된 방법의 계산 비용이 여전히 높을 수 있습니다. 근사 기법을 사용하지만, 최적 수송 매핑 계산 자체가 복잡할 수 있습니다.
◦
Wasserstein 중심을 근사하는 과정에서 발생하는 오차가 모델의 공평성 향상에 미치는 영향에 대한 추가적인 분석이 필요합니다.
◦
특정한 유형의 다중 출력 모델에만 적용 가능할 수 있으며, 모든 종류의 다중 출력 모델에 대해 일반화 가능성을 검증할 필요가 있습니다.
◦
실험적 결과의 일반화 가능성을 높이기 위해 더 다양하고 대규모의 데이터셋에 대한 실험이 필요합니다.