Non-Uniform Class-Wise Coreset Selection for Vision Model Fine-tuning
Created by
Haebom
Category
Empty
저자
Hanyu Zhang, Zhen Xing, Ruian He, Wenxuan Yang, Chenxi Ma, Weimin Tan, Bo Yan
개요
본 논문은 대규모 파운데이션 모델의 효율적인 파인튜닝을 위해 데이터의 작은 부분집합을 선택하는 코어셋 선택 방식을 제안합니다. 기존의 클래스 불가지론적 방법이 각 클래스별 난이도 차이를 고려하지 못하여 성능 저하를 일으키는 문제를 해결하기 위해, 본 논문은 클래스 수준 및 샘플 수준 난이도를 모두 고려하는 Non-Uniform Class-Wise Coreset Selection (NUCS) 프레임워크를 제안합니다. NUCS는 클래스별 난이도를 측정하고, 이를 기반으로 클래스 간 데이터 예산 할당을 비균등하게 수행하며, 각 클래스 내에서 최적의 난이도 범위를 가진 샘플을 선택합니다. 다양한 시각적 분류 작업에 대한 실험을 통해 NUCS가 기존 방법보다 우수한 정확도와 계산 효율성을 달성함을 입증했습니다.
시사점, 한계점
•
시사점:
◦
클래스별 난이도를 고려한 코어셋 선택 방식 제안은 모델 파인튜닝 효율성을 향상시킴.
◦
NUCS는 클래스 간 비균등 데이터 할당 및 클래스 내 적응적 샘플 선택을 통해 성능을 극대화함.
◦
다양한 데이터셋 및 사전 훈련된 모델에 대한 실험을 통해 방법론의 일반화 가능성을 입증함.
•
한계점:
◦
논문에서 구체적인 NUCS의 구현 세부 사항(예: 난이도 측정 방법, 예산 할당 전략)에 대한 추가 정보가 필요할 수 있음.