본 논문은 비디오 게임 QA(품질 보증) 과정의 자동화 및 개선을 위해 Vision-Language Model(VLMs)을 활용하는 방안을 제시합니다. 비디오 게임 산업에서 QA는 여전히 많은 인력을 필요로 하는 과정이며 자동화가 제한적이기 때문에, VLMs의 효과적인 활용을 위한 표준화된 벤치마크의 필요성이 제기됩니다. 이에 본 논문에서는 다양한 게임 QA 활동(시각적 단위 테스트, 시각적 회귀 테스트, 탐색 작업, 결함 감지, 버그 보고서 생성 등)을 포함하는 종합적인 벤치마크인 VideoGameQA-Bench를 소개합니다. 이 벤치마크는 이미지와 비디오 데이터를 모두 포함하며, 실제 시나리오에서 VLMs의 성능을 정확하게 평가하는 데 기여합니다. 코드와 데이터는 공개적으로 제공됩니다.