Vision-Language Model (VLM)의 표현은 인종적 편향을 증폭시키고, 이로 인해 다운스트림 작업에서 편향된 연관과 잘못된 예측이 발생합니다. 본 논문은 이러한 편향 완화를 위해 기존의 좌표별 접근 방식의 한계를 지적하고, 선형적으로 디코딩 가능한 편향의 전체 부분 공간을 식별하고 제거하는 기하학적 원리를 기반으로 한 Subspace Projection Debiasing (SPD) 프레임워크를 제안합니다. SPD는 중립적인 평균 성분을 재삽입하여 의미적 충실도를 유지하며, 실험을 통해 기존 방법 대비 더 강력한 편향 완화 효과를 보임을 입증합니다.
시사점, 한계점
•
시사점:
◦
VLM의 편향 문제를 해결하기 위한 새로운 접근 방식 제시: Subspace Projection Debiasing (SPD)
◦
기존 좌표별 방식의 한계점 명확히 제시: 특징 얽힘, 교차 데이터셋 일반화 실패, 불완전한 편향 제거