Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

FQ-PETR: Fully Quantized Position Embedding Transformation for Multi-View 3D Object Detection

Created by
  • Haebom
Category
Empty

저자

Jiangyong Yu, Changyong Shu, Sifan Zhou, Zichen Yu, Xing Hu, Yan Chen, Dawei Yang

개요

자율 주행에 필수적인 카메라 기반 다중 뷰 3D 감지에서 PETR 및 변형 모델(PETRs)은 성능은 뛰어나지만, 높은 계산 비용과 메모리 사용량으로 인해 실제 배포에 어려움이 있었다. 본 논문에서는 PETRs의 완전 양자화 프레임워크인 FQ-PETR을 제안한다. FQ-PETR은 (1) 양자화 친화적인 LiDAR-ray 위치 임베딩(QFPE), (2) 이중 조회 테이블(DULUT), (3) 수치 안정화 후 양자화(QANS)를 통해 W8A8 양자화에서도 거의 부동 소수점 수준의 정확도(1% 미만 성능 저하)를 유지하면서 최대 75%의 지연 시간을 단축하여 기존 PTQ 및 QAT 기반 모델보다 우수한 성능을 달성했다.

시사점, 한계점

시사점:
PETRs의 효율적인 양자화를 위한 새로운 프레임워크인 FQ-PETR 제안
QFPE, DULUT, QANS를 통해 양자화 시 정확도 저하 문제를 해결
W8A8 양자화에서 기존 방법 대비 뛰어난 성능과 지연 시간 단축
한계점:
특정 PETR 아키텍처(PETR, StreamPETR, PETRv2, MV2d)에 대한 성능 검증
일반화 성능에 대한 추가적인 연구 필요
특정 하드웨어 환경에서의 성능 최적화에 대한 고려 부족
👍