Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

OAD-Promoter: Enhancing Zero-shot VQA using Large Language Models with Object Attribute Description

Created by
  • Haebom
Category
Empty

저자

Quanxing Xu, Ling Zhou, Feifei Zhang, Jinyu Tian, Rubing Huang

개요

본 논문은 대규모 언어 모델(LLM)을 활용한 시각 질의 응답(VQA)에서 발생하는 언어적 편향과 out-of-distribution (OOD) 일반화 문제를 해결하기 위해 Object Attribute Description Promoter (OAD-Promoter)를 제안합니다. OAD-Promoter는 Object-concentrated Example Generation (OEG) 모듈, Memory Knowledge Assistance (MKA) 모듈, OAD Prompt로 구성되어 편향 완화 및 도메인 변화에 대한 견고성을 향상시킵니다. 실험 결과, OAD-Promoter는 few-shot 또는 zero-shot 환경에서 LLM 기반 VQA 방법의 성능을 크게 향상시켰습니다.

시사점, 한계점

시사점:
LLM 기반 VQA에서 언어적 편향 완화 및 OOD 일반화 성능 향상
OEG, MKA, OAD Prompt를 활용한 새로운 접근 방식 제시
few-shot 및 zero-shot 설정에서 SOTA 달성
한계점:
논문에 구체적인 한계점에 대한 언급 없음 (추후 연구에서 보완 필요)
👍