ICED: Concept-level Machine Unlearning via Interpretable Concept Decomposition

작성자

Haebom

카테고리

Empty

저자

Shen Lin, Jing Lin, Junhao Dong, Piotr Koniusz, Li Xu

💡 개요

기존 비전-언어 모델(VLM)의 기계 학습 제거는 이미지 또는 개별 데이터 수준에서 이루어져, 목표하지 않은 의미 정보를 보존하면서 특정 개념을 정확하게 제거하는 데 어려움이 있었습니다. 본 논문에서는 다중모드 대규모 언어 모델을 활용하여 망각 대상 집합에서 작업별 개념 어휘를 구축하고, 시각 표현을 명시적인 개념 분해를 통해 미세한 지식 조작을 가능하게 하는 ICED 프레임워크를 제안합니다. 이를 통해 목표 개념은 선택적으로 억제하면서도 동일 이미지 내의 비목표 의미와 전역적인 교차 모달 지식을 보존하는 개념 수준 최적화를 수행합니다.

🔑 시사점 및 한계

•

개념 수준에서의 정밀한 지식 제거: 데이터 또는 이미지 전체를 제거하는 대신, 특정 개념만을 선택적으로 제거함으로써 목표 지식을 정밀하게 망각하고 관련 없는 정보를 보존할 수 있습니다.

•

해석 가능성 증진: 시각 표현을 명시적인 개념들의 조합으로 분해하여 모델의 작동 방식을 더 잘 이해하고, 이를 기반으로 지식을 조작하는 인터페이스를 제공합니다.

•

모델 유틸리티 유지: 목표 개념 제거 과정에서도 비목표 개념 및 전역적 교차 모달 지식을 효과적으로 보존하여 모델의 전반적인 성능 저하를 최소화합니다.

•

계산 복잡성 및 학습 데이터 의존성: 개념 어휘 구축 및 개념 분해 과정에서 추가적인 계산량이 발생할 수 있으며, 개념 어휘의 품질이 학습 데이터 및 사용하는 대규모 언어 모델에 따라 달라질 수 있습니다.

PDF 보기

Made with Slashpage