본 논문은 비전 변환기(ViT)의 후처리 양자화(PTQ) 시 발생하는 양자화 오류를 줄이기 위한 새로운 프레임워크를 제안한다. 기존 연구들이 훈련된 신경망과 양자화 모델 간의 관계를 간과하는 문제점을 지적하며, 특히 저비트 모델에 적합한 모델 독립적인 신경망을 효율적으로 훈련하는 방법을 제시한다. 핵심 아이디어는 평탄한(flat) full precision 신경망이 저비트 양자화에 중요하다는 점을 발견하고, 활성화 양자화 오류(AQE)와 가중치 양자화 오류(WQE)를 독립적인 가우시안 노이즈로 모델링하여 오류 소스를 분리하고 최소화하는 노이즈 주입 최적화 방법을 통해 모델을 사전 조건화하는 것이다. 실험 결과는 제안하는 방식의 효과를 입증하며, 저비트 PTQ 모델 획득에 새로운 길을 열었다.