본 논문은 대규모 비전-언어 모델(LVLMs)의 시각적 개수 세기 능력을 다양한 데이터셋에서 평가하고, 개체 수가 증가함에 따라 성능이 저하되는 문제점을 지적합니다. 이를 해결하기 위해, 개수 세기 문제를 하위 작업으로 분할하는 '분할 정복' 접근 방식을 기반으로 한 간단하지만 효과적인 기준 방법을 제안합니다. 이 방법은 개체 분할로 인한 중복 계산을 방지하는 메커니즘을 포함하여 LVLMs의 대량 개체 계산 능력을 향상시킵니다. 다양한 데이터셋과 벤치마크를 통해 제안된 방법의 효과를 입증하고, 향후 연구를 위한 중요한 기준을 제시합니다.