Constraining Sequential Model Editing with Editing Anchor Compression

Created by

Haebom

저자

Hao-Xiang Xu, Jun-Yu Ma, Zhen-Hua Ling, Ningyu Zhang, Jia-Chen Gu

💡 개요

대규모 언어 모델(LLM)은 잘못되거나 오래된 지식으로 인한 환각(hallucination) 문제를 겪습니다. 모델 재학습의 높은 자원 요구량 때문에 모델 편집에 대한 연구가 중요해지고 있으나, 순차적인 모델 편집은 LLM의 전반적인 능력 저하를 유발합니다. 본 논문은 편집 횟수가 늘어남에 따라 파라미터 행렬의 편차가 커져 원래 지식 연관성을 훼손하고 전반적인 능력을 저하시킨다는 사실을 통계적으로 관찰합니다. 이를 해결하기 위해, 제안된 Editing Anchor Compression (EAC) 프레임워크는 새로운 관계를 인코딩하는 데 중요하면서도 원래 행렬로부터 과도하게 벗어나지 않는 편집 앵커를 선택하여 편집 정보를 압축함으로써 순차 편집 중 파라미터 행렬의 편차를 제어합니다.

🔑 시사점 및 한계

•

순차적인 모델 편집 시 발생하는 파라미터 행렬의 편차를 효과적으로 제어하여 LLM의 전반적인 능력을 보존하는 새로운 프레임워크(EAC)를 제안합니다.

•

제안된 EAC 프레임워크는 두 가지 인기 있는 편집 방법과 세 가지 LLM, 네 가지 작업에 대한 실험에서 70% 이상의 전반적인 능력을 보존하면서도 편집된 지식을 더 잘 유지함을 보여줍니다.

•

EAC는 편집 앵커 선택을 통해 편집 정보를 압축함으로써 편집으로 인한 비합리적인 편차를 최소화하는 새로운 접근 방식을 제시합니다.

•

향후 연구에서는 EAC 프레임워크의 효율성을 더욱 높이고, 다양한 LLM 및 편집 방법론에 대한 적용 가능성을 탐색할 필요가 있습니다.

PDF 보기

Made with Slashpage