본 논문은 3D 지각 네트워크의 효율적인 배포를 위한 새로운 하이브리드 양자화 알고리즘인 PTQAT(Post-Training Quantization-Aware Training)을 제안합니다. PTQ(Post-Training Quantization)의 속도와 QAT(Quantization-Aware Training)의 정확도 사이의 절충점을 해결하기 위해, PTQAT는 QAT 미세 조정을 위한 중요한 레이어를 선택하고 나머지 레이어에는 PTQ를 수행합니다. 기존의 직관과 달리, 양자화 전후의 출력 차이가 작은 레이어를 미세 조정하는 것이 차이가 큰 레이어를 미세 조정하는 것보다 모델의 양자화 정확도를 더 크게 향상시킨다는 것을 발견했습니다. 이는 양자화 오류가 발생하는 지점에서 해결하는 것이 아니라 오류의 전파 과정에서 보상하는 것이 더 효과적임을 의미합니다. PTQAT는 양자화 가능한 레이어의 약 50%를 고정시킴으로써 QAT와 유사한 성능을 더욱 효율적으로 달성합니다. 또한, 다양한 양자화 비트 너비(4비트)와 CNN 및 Transformer를 포함한 다양한 모델 아키텍처를 지원하는 범용 양자화 방법입니다. nuScenes 데이터셋을 이용한 실험 결과, 객체 탐지, 의미 분할, 점유율 예측 등 다양한 3D 지각 작업에서 QAT 기준 모델보다 일관되게 우수한 성능을 보였습니다. 특히, 객체 탐지에서 0.2%-0.9% NDS 및 0.3%-1.0% mAP 향상, 의미 분할 및 점유율 예측에서 0.3%-2.0% mIoU 향상을 달성했습니다.