Probing Perceptual Constancy in Large Vision-Language Models
Created by
Haebom
저자
Haoran Sun, Bingyang Wang, Suyang Yu, Yijiang Li, Qingying Gao, Haiyun Lyu, Hokin Deng, Dezhi Luo
개요
시각적 대상의 안정적인 지각 능력을 의미하는 지각 항상성을 시각 언어 모델(VLM)에서 탐구한 연구입니다. 색상, 크기, 형태 항상성이라는 세 가지 영역에서 236개의 실험을 통해 155개의 VLM을 평가했습니다. 실험은 단일 이미지와 비디오를 활용한 고전적 인지 과제와 실제 환경에서의 새로운 과제를 포함했습니다.