House of Cards: Massive Weights in LLMs

작성자

Haebom

카테고리

Empty

저자

Jaehoon Oh, Seungjun Shin, Dokwan Oh

개요

본 논문은 대규모 언어 모델(LLM)의 성능 저하를 야기하는 "대규모 활성화(massive activations)" 현상에 대해 분석하고, 이를 해결하기 위한 새로운 방법을 제시합니다. 대규모 활성화는 특정 특징 차원의 은닉 상태에서 나타나는 현상으로, 특정 토큰에 과도하게 집중하는 편향을 초래합니다. 논문은 대규모 활성화의 원인이 초기 레이어의 피드포워드 네트워크 모듈의 중간 상태에 있는 특정 가중치(top-$k$ massive weights)에 있음을 밝힙니다. 이러한 가중치를 제거하면 LLM의 기능이 완전히 손상되지만, 이 가중치만 남기고 나머지를 제거하면 성능 저하가 상대적으로 적습니다. 이를 바탕으로, 미세 조정 과정에서 대규모 가중치에 대한 의존도를 줄이는 플러그 앤 플레이 방식인 MacDrop(massive weights curriculum dropout)을 제안합니다. MacDrop은 미세 조정 과정에서 대규모 가중치에 드롭아웃을 적용하고, 드롭아웃 확률을 점진적으로 감소시키는 방법입니다. 실험 결과, MacDrop은 제로샷 하위 작업, 장문맥스트 작업 등에서 성능 향상과 강건성 향상을 보였습니다.