LLM-NEO: Parameter Efficient Knowledge Distillation for Large Language Models

작성자

Haebom

카테고리

비어 있음

저자

Runming Yang, Taiqiang Wu, Jiahao Wang, Pengfei Hu, Yik-Chung Wu, Ngai Wong, Yujiu Yang

개요

본 논문은 지식 증류(KD)와 저랭크 적응(LoRA)이 동일한 패러다임을 따른다는 점을 밝히고, 이를 바탕으로 매개변수 효율적인 지식 증류 방법인 LLM-NEO를 제안합니다. LLM-NEO는 LoRA를 KD에 통합하여 지식 전달의 효율성을 향상시키며, 하이퍼파라미터에 대한 유용한 지침을 제시합니다. Llama 2와 Llama 3.2를 압축하는 실험 결과, LLM-NEO가 다양한 기준 모델보다 우수한 성능을 보임을 확인하였고, LoRA 변형에 대한 강건성도 입증되었습니다. 코드와 훈련된 모델은 Github에서 공개됩니다.