Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Diverging Towards Hallucination: Detection of Failures in Vision-Language Models via Multi-token Aggregation

Created by
  • Haebom

저자

Geigh Zollicoffer, Minh Vu, Manish Bhattarai

개요

본 논문은 시각-언어 모델(VLMs)의 환각(hallucination) 문제를 해결하기 위해 기존의 단일 토큰 분석 기반 환각 검출기의 한계를 지적하고, 다중 토큰을 활용한 새로운 검출 방법인 MTRE(Multi-Token Reliability Estimation)를 제안합니다. 기존 방법들이 초기 토큰의 logit만 분석하는 것과 달리, MTRE는 초기 10개 토큰의 logit을 다중 토큰 로그 우도 비율과 self-attention을 이용하여 종합적으로 분석합니다. KL divergence를 활용하여 환각과 비환각 토큰 간의 logit 차이를 분석함으로써, 환각이 여러 토큰 생성 후에 나타나는 점을 강조합니다. 실험 결과, MAD-Bench, MM-SafetyBench, MathVista 등 다양한 벤치마크에서 기존 방법들보다 AUROC 성능을 크게 향상시켜 환각 검출 분야의 새로운 state-of-the-art를 달성했습니다.

시사점, 한계점

시사점:
VLMs의 환각 문제 해결에 있어 초기 토큰뿐 아니라 다중 토큰의 logit 분석이 중요함을 보여줌.
MTRE는 경량화된 white-box 방법으로 효율적이고 적용 가능성이 높음.
다양한 벤치마크에서 기존 방법 대비 우수한 성능을 보임.
환각 발생 메커니즘에 대한 이해를 심화시키는 데 기여.
한계점:
현재는 초기 10개 토큰만 고려, 더 많은 토큰을 분석하는 방법에 대한 추가 연구 필요.
특정 벤치마크에 대한 성능 최적화 가능성 존재.
다양한 VLM 아키텍처에 대한 일반화 성능 검증 필요.
👍