본 논문은 모바일 기기에서 대규모 확산 모델을 사용자 지정 애플리케이션에 맞게 미세 조정하는 데 필요한 상당한 전력 및 시간 소모 문제를 해결하기 위해, 저랭크 적응(LoRA)을 위한 새로운 학습 가속기를 제안합니다. 전체 양자화 학습 기법을 활용하여 LoRA 미세 조정 과정에서 메모리 사용량과 전력 소비를 크게 줄이면서 높은 모델 충실도를 유지합니다. 제안된 가속기는 유연한 데이터 흐름을 특징으로 하여 LoRA 과정 중 불규칙하고 가변적인 텐서 형태에 대해 높은 활용도를 제공합니다.