본 논문은 기존의 one-shot coreset selection 방법들이 데이터 난이도의 클래스 간 이질성을 고려하지 않고 클래스 내 균질성을 가정하는 한계를 지적합니다. 특히 네트워크 침입 탐지 및 의료 영상과 같은 분야에서 데이터 난이도가 클래스별로 다르게 분포하는 현상(Class-Difficulty Separability)을 밝히고, 이를 정량화하는 지표인 Class Difficulty Separability Coefficient (CDSC)를 제시합니다. 높은 CDSC 값은 클래스 비고려 코어셋 방법에서 성능 저하와 연관됨을 보이며, 이는 쉬운 다수 클래스를 과대 표현하고 중요하지만 드문 클래스를 무시하기 때문임을 설명합니다. 이를 해결하기 위해 다양한 샘플링 전략에 클래스 비율을 고려한 변형을 제시하고, 5개의 다양한 데이터셋에서 기존 방법들을 능가하는 데이터 효율성을 보임을 실험적으로 증명합니다. 특히, 높은 pruning 비율(99%)에서도 안정적인 성능을 보이며, 클래스 비고려 방법과 비교하여 성능 저하를 크게 감소시킵니다. 결론적으로, 클래스 난이도 분리성을 명시적으로 모델링하는 것이 효과적이고 견고하며 일반화된 데이터 가지치기에 중요함을 강조합니다.