HELLoRA: Hot Experts Layer-Level Low-Rank Adaptation for Mixture-of-Experts Models

작성자

Haebom

카테고리

Empty

저자

Jia Wei, Zhonghao Zhang, Ping Chen, Qianyang li, Yancheng Pan, Shaoxun Wang, Ziyi Qiu, Longxiang Wang

💡 개요

본 논문은 Mixture-of-Experts (MoE) 모델의 효율적인 파라미터 적응을 위해, 각 레이어에서 가장 빈번하게 활성화되는 전문가(expert)에만 LoRA 모듈을 적용하는 "Hot Experts Layer-level Low-Rank Adaptation" (HELLoRA)을 제안합니다. HELLoRA는 학습 가능한 파라미터 수와 연산량을 줄이면서도 성능을 향상시키며, 이는 사전 학습된 전문가의 전문성을 유지하는 구조적 정규화 효과 덕분입니다.

🔑 시사점 및 한계

•

MoE 모델 구조의 희소성을 활용하여 파라미터 효율적인 미세조정(PEFT)의 효율성을 극대화할 수 있습니다.

•

활성화 기반의 어댑터 배치 전략이 MoE 모델에 대한 PEFT 확장에 효과적이고 실용적임을 보여줍니다.

•

LoRI와의 결합(HELLoRI)을 통해 극단적인 파라미터 예산에서도 성능을 유지할 수 있습니다.

•

특정 전문가의 편중된 활성화 패턴이 모든 MoE 모델에서 동일하게 나타나지 않을 수 있으며, 이에 대한 추가적인 연구가 필요할 수 있습니다.

PDF 보기

Made with Slashpage