Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Adaptive Token Merging for Efficient Transformer Semantic Communication at the Edge

Created by
  • Haebom

저자

Omar Erak, Omar Alhussein, Hatem Abou-Zeid, Mehdi Bennis, Sami Muhaidat

개요

본 논문은 자원 제약이 있는 에지 디바이스에서 대규모 트랜스포머 모델의 배포를 위한 훈련 없이 적응적으로 토큰을 병합하는 프레임워크를 제시합니다. 레이어별 유사도 임계값을 기반으로 의미적으로 중복된 토큰을 선택적으로 병합하여 런타임에 트랜스포머 표현을 압축하는 새로운 메커니즘인 적응형 토큰 병합을 소개합니다. 기존의 고정 비율 축소와 달리, 본 연구의 접근 방식은 병합을 입력 중복도와 직접적으로 연결하여 재훈련 없이 효율성과 작업 관련성 간의 균형을 맞추는 데이터 종속적 적응을 가능하게 합니다. 병합 전략 발견을 다목적 최적화 문제로 설정하고 베이지안 최적화를 활용하여 정확도, 추론 비용 및 통신 비용 간의 Pareto 최적 절충안을 얻습니다. ImageNet 분류 작업에서 수정되지 않은 트랜스포머의 정확도와 동일한 수준을 유지하면서 초당 부동 소수점 연산 수를 30% 줄이고 원래 통신 비용의 20% 미만으로 줄였으며, 시각적 질문 응답 작업에서는 계산량의 1/3 미만과 대역폭의 1/10 미만으로 전체 LLaVA 모델과 경쟁력 있는 성능을 달성했습니다. 또한, 본 연구의 적응형 병합은 다양한 채널 조건에서 강건하며, 모델 역공격의 효과를 크게 저하시켜 고유한 개인 정보 보호 이점을 제공합니다. 본 프레임워크는 자원 제약이 있는 에지 인텔리전스 시나리오에서 강력한 트랜스포머 모델을 배포하기 위한 실용적이고 다재다능한 솔루션을 제공합니다.

시사점, 한계점

시사점:
훈련 없이 트랜스포머 모델의 크기를 효과적으로 줄이는 새로운 적응형 토큰 병합 기법 제시.
ImageNet 분류 및 시각적 질문 응답 작업에서 기존 모델 대비 낮은 계산량 및 통신 비용으로 경쟁력 있는 성능 달성.
다양한 채널 조건에서 강건하며, 모델 역공격에 대한 내성 향상으로 개인 정보 보호 강화.
에지 디바이스에서의 대규모 트랜스포머 모델 배포 가능성 확대.
한계점:
제안된 방법의 성능은 베이지안 최적화의 성능에 의존적일 수 있음.
특정 유형의 작업에 대한 최적화된 매개변수 설정이 다른 작업에서는 효율적이지 않을 수 있음.
다양한 종류의 트랜스포머 모델과 작업에 대한 일반화 성능 평가가 추가적으로 필요함.
실제 에지 디바이스 환경에서의 종합적인 성능 평가가 필요함.
👍