Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Range Asymmetric Numeral Systems-Based Lightweight Intermediate Feature Compression for Split Computing of Deep Neural Networks

Created by
  • Haebom
Category
Empty

저자

Mingyu Sung, Suhwan Im, Vikas Palakonda, Jae-Mo Kang

개요

본 논문은 자원 제약적인 엣지 디바이스와 클라우드 서버 간의 딥 뉴럴 네트워크 추론 분산 처리에 있어 발생하는 통신 병목 현상을 해결하기 위해, rANS 인코딩, 비대칭 정수 양자화, 희소 텐서 표현을 활용하는 경량 압축 프레임워크를 제안한다. 제안하는 방법은 복잡한 확률 모델링이나 네트워크 수정 없이 텐서 희소성을 활용하여 대역폭을 줄이고, 텐서 재형성 차원을 최적화하며, GPU 가속 구현을 통해 빠른 인코딩/디코딩 속도를 제공한다. 다양한 신경망 아키텍처와 자연어 처리 작업에 대한 실험을 통해, 제안하는 프레임워크가 모델 정확도를 유지하면서 대역폭 제한 환경에서 AI 시스템 배포를 개선할 수 있음을 입증한다.

시사점, 한계점

시사점:
rANS 인코딩, 비대칭 정수 양자화, 희소 텐서 표현을 결합하여 통신 오버헤드를 줄이는 경량 압축 프레임워크 제안
복잡한 확률 모델링이나 네트워크 수정 없이 텐서 희소성을 활용
텐서 재형성 차원 최적화를 통한 압축 효율 극대화
GPU 가속 구현으로 빠른 인코딩/디코딩 속도 제공
다양한 신경망 아키텍처 및 자연어 처리 작업에 대한 광범위한 검증
모델 성능 저하 없이 대역폭 제한 환경에서의 AI 시스템 배포 가능성 제시
한계점:
논문에 구체적인 한계점 언급 없음.
👍