Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

From Coefficients to Directions: Rethinking Model Merging with Directional Alignment

Created by
  • Haebom
Category
Empty

저자

Zhikang Chen, Sen Cui, Deheng Ye, Min Zhang, Gang Niu, Yu Zhang, Masashi Sugiyama, Tingting Zhu

개요

독립적으로 훈련된 여러 모델을 통합하는 모델 병합은 공동 재훈련 없이도 가능하다. 기존 연구들은 파라미터 분해, 계수 최적화, 부분 공간 학습과 같은 전략을 통해 파라미터를 결합하여 강력한 성능을 보였다. 하지만, 이러한 접근 방식은 파라미터 공간 분해 또는 융합 계수 최적화 문제로 취급하며, 파라미터 및 특징 공간의 방향성 정보의 중요성을 간과했다. 본 연구에서는 방향성 정렬을 강조하고, 파라미터 및 특징 공간에서 일관되게 방향성 구조를 정렬하는 통합 기하 프레임워크인 \method{}을 제안한다.

시사점, 한계점

시사점:
방향성 정렬의 중요성을 강조하고, 이를 통해 구조적 일관성을 개선한다.
파라미터 공간과 특징 공간 모두에서 방향성 구조를 정렬하는 새로운 기법인 \method{} 제안.
다양한 벤치마크, 모델 규모, 작업 환경에서 제안된 방법의 효과를 검증.
한계점:
구체적인 한계점은 논문에 명시되지 않음. (제시된 정보만으로는 파악 불가)
👍