Data-Free Group-Wise Fully Quantized Winograd Convolution via Learnable Scales

Created by

Haebom

저자

Shuokai Pan, Gerti Tuzi, Sudarshan Sreeram, Dibakar Gope

개요

본 논문은 대규모 텍스트-이미지 확산 모델의 높은 계산 및 저장 비용 문제를 해결하기 위해, Winograd convolution과 함께 미세한 그룹 단위 양자화를 활용하는 방법을 제안합니다. 기존의 완전 양자화된 Winograd convolution은 품질 저하 문제가 있었으나, 본 논문에서 제안하는 방법은 Winograd 변환 행렬의 스케일 파라미터만 미세 조정하여 이 문제를 해결합니다. 이는 별도의 도메인 특화 학습 데이터 없이도 가능하며, 8비트 완전 양자화된 확산 모델에서도 full-precision 모델과 유사한 품질(FID 및 CLIP 점수)을 유지하며, 이미지 분류 작업에서도 기존 최첨단 방법보다 성능이 향상됨을 보여줍니다.