Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

EdgeProfiler: A Fast Profiling Framework for Lightweight LLMs on Edge Using Analytical Model

Created by
  • Haebom

저자

Alyssa Pinnock, Shakya Jayakody, Kawsher A Roxy, Md Rubel Ahmed

개요

EdgeProfiler는 경량화된 대규모 언어 모델(LLM)의 에지 시스템 성능 평가를 위한 빠른 프로파일링 프레임워크입니다. 기존 LLM의 높은 계산, 메모리, 전력 요구량으로 인해 클라우드 환경에 국한되는 문제를 해결하기 위해, TinyLLaMA, Gemma3.1B, Llama3.2-1B, DeepSeek-r1-1.5B 등의 압축된 LLM을 공격적인 양자화 기법과 엄격한 메모리 제약 조건 하에서 프로파일링합니다. 분석적 모델링을 통해 지연 시간, FLOPs, 에너지 소비량을 추정하며, 4비트 양자화를 통해 모델 메모리 사용량을 약 60-70% 줄이면서 정확도는 전체 정밀도 기준 대비 2-5% 이내로 유지함을 보여줍니다. 다양한 에지 장치에서 추론 속도는 FP16 기준 대비 2-3배 향상되고, INT4 구성에서 에너지 소비량은 35-50% 감소하여 Raspberry Pi 4/5 및 Jetson Orin Nano Super와 같은 하드웨어에서 실용적인 배포가 가능함을 보여줍니다. 결론적으로 경량 LLM의 에지 환경에 맞춘 효율적인 프로파일링의 중요성을 강조하며, 정확도, 에너지 효율 및 계산 가능성 간의 균형을 강조합니다.

시사점, 한계점

시사점:
경량 LLM의 에지 배포를 위한 효율적인 프로파일링 프레임워크인 EdgeProfiler 제시.
4비트 양자화를 통한 메모리 사용량 감소 (60-70%) 및 추론 속도 향상 (2-3배) 확인.
에너지 소비량 감소 (35-50%)를 통해 Raspberry Pi 및 Jetson Orin Nano Super와 같은 저전력 에지 장치에서의 LLM 배포 가능성 제시.
정확도와 성능 간의 균형을 고려한 실용적인 에지 LLM 배포 전략 제시.
한계점:
평가 대상 LLM의 종류가 제한적일 수 있음.
분석적 모델링에 기반한 에너지 소비량 추정의 정확도에 대한 추가 검증 필요.
다양한 에지 환경 및 작업에 대한 일반화 가능성에 대한 추가 연구 필요.
실제 응용 프로그램에 적용 시 발생할 수 있는 문제점에 대한 추가적인 분석 필요.
👍