Sign In

BalancEdit: Dynamically Balancing the Generality-Locality Trade-off in Multi-modal Model Editing

Created by
  • Haebom
Category
Empty

저자

Dongliang Guo, Mengxuan Hu, Zihan Guan, Thomas Hartvigsen, Sheng Li

개요

본 논문은 대규모 다중 모달 모델의 지식이 시간 경과에 따라 퇴화되는 문제를 해결하기 위해, 모델의 직접적인 지식 편집에 초점을 맞추고 있습니다. 기존의 미세 조정 방식 대신, 각 사실의 영향 범위(일반성과 지역성)를 고려하여 균형 잡힌 모델 편집을 수행하는 새로운 방법인 BalancEdit을 제안합니다. BalancEdit은 각 사실에 대한 양성 및 음성 샘플을 생성하여 영향 범위를 정확하게 파악하고, 이를 바탕으로 수정된 코드북을 활용하여 모델의 잠재 공간을 수정합니다. 이는 기존 모델 편집 기법의 일반성과 지역성 간의 상충 관계를 명시적으로 해결하는 최초의 시도이며, OKEDIT라는 새로운 모델 편집 데이터셋을 통해 성능을 평가합니다. 실험 결과, BalancEdit은 견고한 편집 능력을 유지하면서 최소한의 상충 관계만을 보이는 것을 확인했습니다.

시사점, 한계점

시사점:
대규모 다중 모달 모델의 지식 퇴화 문제에 대한 효과적인 해결책 제시.
모델의 직접적인 지식 편집을 통해 미세 조정의 어려움을 극복.
일반성과 지역성 간의 상충 관계를 고려한 균형 잡힌 모델 편집 방법 제시.
새로운 모델 편집 데이터셋 OKEDIT 공개.
BalancEdit의 효과성을 실험적으로 검증.
한계점:
OKEDIT 데이터셋의 규모 및 다양성에 대한 추가적인 검토 필요.
BalancEdit의 성능이 다양한 다중 모달 모델 및 작업에 대해 얼마나 일반화될 수 있는지 추가 연구 필요.
현재 접근 방식의 확장성 및 계산 비용에 대한 추가적인 분석 필요.
👍