시각적 대규모 언어 모델(VLLMs)의 발전은 텍스트와 시각적 요소를 모두 포함하는 시각적으로 풍부한 문서(VRDs)의 자동 이해에 혁명을 가져왔습니다. VLLMs는 다중 페이지 VRDs에 대한 시각적 질의 응답(VQA)에서 뛰어나지만, 답할 수 없는 질문을 감지하는 능력은 여전히 열린 연구 문제입니다. 이 연구는 관련 개념 간의 교환 또는 그럴듯한 질문 공식화로 인해 발생하는 미묘한 손상으로 인해 유효해 보이지만 답할 수 없는 그럴듯한 질문에 대한 VLLMs의 견고성을 탐구합니다. VRD-UQA(VISUALLY RICH DOCUMENT UNANSWERABLE QUESTION ANSWERING)를 제시하여 여러 차원에서 그럴듯하지만 답할 수 없는 질문에 대한 VLLMs의 복원력을 평가하는 벤치마크를 제공합니다. 기존 VQA 데이터세트의 질문을 자동으로 변경하고, VLLM-as-a-judge 접근 방식을 사용하여 답할 수 없음을 확인한 후, VLLMs의 성능을 철저히 평가합니다.