본 논문은 State Space Models (SSMs)의 확장성 문제를 해결하기 위해, 다양한 플랫폼에서의 배포를 위한 양자화 기법인 Quamba2를 제시합니다. Quamba2는 W8A8, W4A8, W4A16 등의 저비트 양자화를 지원하며, Mamba1과 Mamba2 백본 모두와 호환됩니다. 채널 순서 보존 및 활성화 지속성을 활용하여 오프라인 양자화 방식을 제안하며, 입력 x에 대한 정렬 및 클러스터링과 상태 그룹별 양자화를 통해 계산 불변성을 유지합니다. 실험 결과, Quamba2-8B는 기존 최첨단 방법보다 우수한 성능을 보이며, 속도 향상과 메모리 감소 효과를 달성하면서 정확도 저하를 최소화합니다.