Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

SAGE: Spuriousness-Aware Guided Prompt Exploration for Mitigating Multimodal Bias

Created by
  • Haebom
Category
Empty

저자

Wenqian Ye, Di Wang, Guangtao Zheng, Bohan Liu, Aidong Zhang

개요

CLIP과 같은 대형 비전-언어 모델은 이미지와 텍스트를 공유 임베딩 공간에 정렬하여 강력한 제로샷 분류 성능을 보여줍니다. 그러나 이러한 모델은 종종 스퓨리어스(spurious) 바이어스를 갖는데, 이는 부적절한 특징에 의존하는 경향입니다. 예를 들어, 배경과 같은 관련 없는 특징에 기반하여 객체를 추론할 수 있습니다. 본 논문에서는 제로샷 분류에서 다중 모드 스퓨리어스 바이어스의 영향을 이론적으로 분석하고, 가이드된 프롬프트 선택을 통해 스퓨리어스 바이어스를 완화하는 간단하고 효과적인 방법인 SAGE (Spuriousness-Aware Guided Exploration)를 제안합니다. SAGE는 훈련, 미세 조정 또는 외부 주석이 필요하지 않습니다. 광범위한 실험을 통해 SAGE가 제로샷 성능과 일반화를 일관적으로 개선하며, 기존 제로샷 방식보다 우수함을 입증합니다.

시사점, 한계점

시사점:
SAGE는 제로샷 분류에서 스퓨리어스 바이어스 문제를 해결하는 효과적인 방법입니다.
훈련, 미세 조정 또는 외부 지식 없이 제로샷 성능을 향상시킵니다.
다양한 모델 및 데이터셋에서 일관된 성능 향상을 보입니다.
한계점:
논문에 제시된 한계점은 명시되지 않았습니다.
👍