본 논문은 Vision Language Model(VLM)이 보존 법칙을 이해하는 능력을 평가하기 위해 ConserveBench라는 365개의 인지 실험 배터리를 개발하고 그 결과를 제시합니다. ConserveBench는 부피, 고체량, 길이, 숫자라는 네 가지 물리량의 차원에 걸쳐 구성되었으며, 부피와 고체량은 가역성 이해를 요구하는 변환 과제, 길이와 숫자는 양 개념 이해를 평가하는 비변환 과제로 구성됩니다. 실험 결과, VLM은 변환 과제에서는 상대적으로 높은 성능을 보였으나, 비변환 과제에서는 낮은 성능을 보였습니다. 이는 인간의 보존 법칙 이해의 기반이 되는 가역성 이해와 양 개념 이해 사이의 분리가 VLM에서도 존재함을 시사합니다.