본 논문은 심층 신경망(DNNs)의 급속한 발전에도 불구하고, 실제 배포 시 높은 계산 비용과 큰 모델 크기 문제를 해결하기 위한 모델 양자화 기술에 대한 5년간의 연구 진전을 조사한 논문입니다. 양자화는 연속적인 부동소수점 수를 이산적인 정수로 변환하여 메모리 입출력과 계산 속도를 높이지만, 정밀도 손실로 인한 성능 저하 문제를 야기합니다. 본 논문에서는 최신 양자화 방법들을 핵심 기술에 따라 8가지 주요 범주와 24개의 하위 범주로 분류하고 비교 분석하며, 향후 연구 방향을 제시합니다. GitHub 저장소(https://github.com/Kai-Liu001/Awesome-Model-Quantization)를 통해 양자화 모델 목록도 제공합니다.
시사점, 한계점
•
시사점:
◦
DNN 모델 양자화 기술의 최신 동향을 종합적으로 분석하고 분류하여 연구 현황을 명확히 제시.
◦
다양한 양자화 방법들의 강점과 약점을 비교 분석하여 효율적인 방법 선택에 도움을 제공.
◦
향후 연구 방향을 제시하여 DNN 모델 경량화 및 효율화 연구에 기여.
◦
GitHub 저장소를 통해 관련 연구 및 자료 접근성 향상.
•
한계점:
◦
5년간의 연구 진전만을 다루어, 그 이전의 연구는 다루지 않음.
◦
제시된 분류 체계가 모든 양자화 방법을 완벽하게 포괄하지 못할 수 있음.
◦
각 양자화 방법의 성능 비교가 정량적인 실험 결과에 기반하지 않고 기술적인 비교에 그칠 수 있음.