FQ-PETR: Fully Quantized Position Embedding Transformation for Multi-View 3D Object Detection
Created by
Haebom
Category
Empty
저자
Jiangyong Yu, Changyong Shu, Sifan Zhou, Zichen Yu, Xing Hu, Yan Chen, Dawei Yang
개요
자율 주행에 필수적인 카메라 기반 다중 뷰 3D 감지에서 PETR 및 변형 모델(PETRs)은 성능은 뛰어나지만, 높은 계산 비용과 메모리 사용량으로 인해 실제 배포에 어려움이 있었다. 본 논문에서는 PETRs의 완전 양자화 프레임워크인 FQ-PETR을 제안한다. FQ-PETR은 (1) 양자화 친화적인 LiDAR-ray 위치 임베딩(QFPE), (2) 이중 조회 테이블(DULUT), (3) 수치 안정화 후 양자화(QANS)를 통해 W8A8 양자화에서도 거의 부동 소수점 수준의 정확도(1% 미만 성능 저하)를 유지하면서 최대 75%의 지연 시간을 단축하여 기존 PTQ 및 QAT 기반 모델보다 우수한 성능을 달성했다.
시사점, 한계점
•
시사점:
◦
PETRs의 효율적인 양자화를 위한 새로운 프레임워크인 FQ-PETR 제안
◦
QFPE, DULUT, QANS를 통해 양자화 시 정확도 저하 문제를 해결
◦
W8A8 양자화에서 기존 방법 대비 뛰어난 성능과 지연 시간 단축
•
한계점:
◦
특정 PETR 아키텍처(PETR, StreamPETR, PETRv2, MV2d)에 대한 성능 검증