본 논문은 대규모 데이터셋을 작고 정보가 풍부한 합성 데이터로 압축하는 데이터셋 증류(Dataset Distillation) 기술을 다루며, 특히 불균형 데이터셋에서의 성능 저하 문제를 해결하는 데 중점을 둡니다. 소프트 레이블의 중요성을 강조하고, 불균형을 고려한 일반화 경계를 제시하며, 소프트 레이블 편향의 두 가지 주요 원인을 밝힙니다. 이러한 편향을 해결하기 위해, 적응형 소프트 레이블 정렬 모듈(ADSA)을 제안합니다. ADSA는 기존 증류 파이프라인에 통합되어 성능을 향상시키며, ImageNet-1k-LT 데이터셋에서 최대 11.8%의 꼬리 클래스 정확도 향상과 전체 정확도 41.4%를 달성했습니다.