본 논문은 자원 제약이 있는 에지 디바이스에서 실시간 데이터 분석을 위해 딥러닝 모델, 특히 비전 트랜스포머(Vision Transformer, ViT)를 효율적으로 배포하는 새로운 프레임워크인 ED-ViT를 제안합니다. ED-ViT는 ViT 모델을 여러 에지 디바이스에 분할하여 실행하는데, 각 디바이스는 특정 데이터 클래스의 하위 집합을 처리하도록 설계되었습니다. 또한 클래스별 가지치기 기법을 도입하여 각 하위 모델의 크기를 줄이고 계산 오버헤드 및 추론 지연 시간을 추가적으로 감소시킵니다. 다양한 데이터셋과 모델 아키텍처를 사용한 실험을 통해 ED-ViT가 추론 지연 시간을 크게 줄이고 모델 크기를 최대 28.9배 및 34.1배까지 감소시키면서 원본 ViT와 비슷한 테스트 정확도를 유지함을 보여줍니다. CNN 및 SNN 모델을 에지 디바이스에 배포하는 최첨단 방법과의 비교 실험을 통해 ED-ViT의 효과를 입증합니다.
시사점, 한계점
•
시사점:
◦
자원 제약이 있는 에지 디바이스에서 비전 트랜스포머 모델의 효율적인 배포를 위한 새로운 프레임워크 ED-ViT 제시.