본 논문은 데이터셋 증류(Dataset Distillation, DD) 방법론의 성능 향상을 위한 새로운 방법인 EDF(Emphasizes the Discriminative Features)를 제안합니다. 기존 DD 방법론이 CIFAR, MNIST, TinyImageNet과 같은 단순 데이터셋에서는 좋은 성능을 보이지만, ImageNet-1K와 같은 복잡한 데이터셋에서는 성능이 저하되는 문제점을 해결하기 위해, Grad-CAM 활성화 맵을 이용하여 합성 이미지에서 중요한 판별적 영역을 강화하는 전략을 사용합니다. 단순 데이터셋에서는 고활성 영역이 이미지 대부분을 차지하지만, 복잡한 데이터셋에서는 그 크기가 훨씬 작다는 점에 착안하여, 모든 픽셀을 동일하게 다루는 기존 방법과 달리 고활성 영역을 강화합니다. 또한, 손실이 낮은 감독 신호(일반적인 패턴을 포함)의 중요도를 낮추는 접근 방식을 사용하며, 복잡한 시나리오에서 DD 연구를 촉진하기 위해 ImageNet-1K에서 8개의 쉬운 하위 데이터셋과 8개의 어려운 하위 데이터셋으로 구성된 Comp-DD 벤치마크를 구축했습니다. 실험 결과, EDF는 ImageNet-1K 하위 데이터셋과 같은 복잡한 시나리오에서 최첨단(SOTA) 결과를 능가하는 성능을 보입니다. 코드와 벤치마크는 공개적으로 제공될 예정입니다.