Pareto Continual Learning: Preference-Conditioned Learning and Adaption for Dynamic Stability-Plasticity Trade-off
Created by
Haebom
저자
Song Lai, Zhe Zhao, Fei Zhu, Xi Lin, Qingfu Zhang, Gaofeng Meng
개요
본 논문은 지속적 학습에서의 안정성(기존 지식 유지)과 가소성(새로운 과제 적응) 간의 균형 문제를 다룬다. 기존의 경험 재생 방법들이 고정된 균형을 추구하여 최적이 아닌 적응을 초래하는 한계를 지적하며, 안정성-가소성 트레이드오프를 다목적 최적화 문제로 재구성하는 새로운 프레임워크인 Pareto Continual Learning (ParetoCL)을 제안한다. ParetoCL은 다양한 트레이드오프를 나타내는 파레토 최적 해의 집합을 학습하고 추론 중 동적 적응을 가능하게 하는 선호도 조건 모델을 도입한다. 다양한 데이터셋과 설정에 대한 실험 결과, ParetoCL이 최첨단 방법들을 능가하고 다양한 지속적 학습 시나리오에 적응한다는 것을 보여준다.