Sign In

A Woman with a Knife or A Knife with a Woman? Measuring Directional Bias Amplification in Image Captions

Created by
  • Haebom
Category
Empty

저자

Rahul Nair, Bhanu Tokas, Hannah Kerner

개요

편향된 데이터셋으로 모델을 학습하면 데이터 편향을 재현할 뿐만 아니라 테스트 시점에 이를 악화시키는 '편향 증폭' 현상이 발생합니다. 기존의 편향 증폭 측정 지표는 분류 데이터셋에만 적용 가능하며, 캡션의 언어 의미를 파악하지 못하는 한계가 있습니다. 캡션 의미를 이해하는 언어 기반 편향 증폭 지표인 Leakage in Captioning (LIC)이 제안되었지만, 캡션 모델에서 편향 증폭의 원인을 식별할 수 없다는 단점이 있습니다. 본 논문에서는 언어 기반이며 방향성을 갖는 지표인 Directional Bias Amplification in Captioning (DBAC)을 제안합니다. DBAC는 캡션 모델이 편향을 증폭하는 시점을 식별할 수 있으며, LIC보다 (1) 문장 인코더에 덜 민감하고 (2) 캡션 내 편향 증폭을 더 정확하게 추정합니다. COCO 캡션 데이터셋의 성별 및 인종 속성에 대한 실험 결과, DBAC가 캡션에서 편향 증폭을 측정하는 유일한 신뢰할 수 있는 지표임을 보였습니다.

시사점, 한계점

시사점:
캡션 모델의 편향 증폭을 측정하는 새로운 지표 DBAC 제안
DBAC는 캡션 모델에서 편향 증폭의 원인을 식별 가능
LIC보다 문장 인코더에 덜 민감하며, 편향 증폭을 더 정확하게 추정
COCO 캡션 데이터셋 실험을 통해 유효성을 입증
한계점:
구체적인 한계점은 논문 요약에서 명시되지 않음
👍