본 논문은 다양한 압축 기법이 다중 모달 대규모 비전-언어 모델(LVLM)의 성능에 미치는 영향을 종합적으로 분석하는 LVLM-Compress-Bench 프레임워크를 제시한다. 자동 회귀 모델을 위한 두 가지 주요 압축 방식인 KV 캐시 압축과 가중치 압축을 고려하며, 다양한 최첨단 압축 기법(균일, 이상치 감소, 그룹 양자화 등)을 LLaVA 프레임워크의 네 가지 LVLM 변형에 적용한다. 10가지 다중 모달 데이터셋을 사용하여 인식, 지식, 언어 생성, 공간 인식, 시각적 추론, 환각 및 시각적 착각 식별, 독성, 고정관념 및 편향 등 다양한 측면에서 압축의 영향을 평가한다. 실제 및 합성 데이터셋을 활용하여 일반적인 성능 및 윤리적으로 중요한 지표에 대한 압축 효과를 분석하고, KV 및 가중치의 양자화 비용에 따른 LVLMs의 행동을 FP16 기준 모델과 비교한다. 소스 코드는 공개될 예정이다.