FAS: Fast ANN-SNN Conversion for Spiking Large Language Models
Created by
Haebom
저자
Long Chen, Xiaotian Song, Andy Song, BaDong Chen, Jiancheng Lv, Yanan Sun
개요
본 논문은 기존의 Spiking Large Language Model (SLLM) 생성 방법들의 성능 저하 및 높은 계산 비용 문제를 해결하기 위해 새로운 빠른 ANN-SLLM 변환 전략(FAS)을 제안합니다. FAS는 사전 훈련된 모델의 전체 매개변수 미세 조정을 1단계로, 변환 오류 감소 및 정확도 향상을 위한 조잡-미세 보정 방법을 2단계로 사용하여 LLM을 SLLM으로 변환합니다. 다양한 규모의 LLM을 사용한 언어 및 비전-언어 작업 실험 결과, FAS는 최첨단 성능을 달성하면서 추론 지연 시간과 계산 비용을 크게 줄이는 것으로 나타났습니다. 특히, OPT-7B 모델보다 3% 높은 정확도를 8번의 시간 단계만으로 달성하면서 에너지 소비량을 96.63% 감소시켰습니다. 소스 코드는 https://github.com/lc783/FAS 에서 확인할 수 있습니다.