CycliST: A Video Language Model Benchmark for Reasoning on Cyclical State Transitions
Created by
Haebom
Category
Empty
저자
Simon Kohaut, Daniel Ochs, Shun Zhang, Benedict Flade, Julian Eggert, Kristian Kersting, Devendra Singh Dhami
개요
CycliST는 주기적 상태 변환에 대한 텍스트 추론 능력을 평가하기 위해 설계된 새로운 비디오 언어 모델(VLM) 벤치마크 데이터셋입니다. CycliST는 객체 움직임과 시각적 속성에서 주기적 패턴을 특징으로 하는 풍부하게 구조화된 합성 비디오 시퀀스를 생성하여 실제 세계 프로세스의 기본적인 측면을 포착합니다. CycliST는 주기적 객체의 수, 장면의 혼잡함, 조명 조건의 변화를 통해 난이도를 점진적으로 높이는 계층적 평가 시스템을 사용하여 최첨단 모델의 시공간적 인지를 평가합니다.