본 논문은 대규모 데이터셋을 효율적으로 축소하는 데이터셋 증류(DD) 기법의 한계점인 개인정보 유출 위험을 해결하기 위해, 연합 학습 환경에서 개인정보를 보호하는 안전한 연합 데이터셋 증류(SFDD) 프레임워크를 제안한다. 기존의 연합 증류 기법이 증류된 지식으로 전역 모델을 학습하는 데 초점을 맞춘 것과 달리, SFDD는 개별 데이터를 노출하지 않고 증류된 데이터셋을 생성하는 것을 목표로 한다. 경사도 매칭 기반 증류 기법을 분산 환경에 적용하여 클라이언트가 원시 데이터를 공유하지 않고 증류 과정에 참여할 수 있도록 한다. 중앙 집계기는 클라이언트의 업데이트를 통합하여 합성 데이터셋을 반복적으로 개선하며, 데이터 기밀성을 유지한다. 서버가 경사도 업데이트를 이용하여 개인 데이터를 재구성하는 추론 공격에 대한 내성을 확보하기 위해, LDPO-RLD라는 최적화된 지역적 차등 개인정보 보호 기법을 도입한다. 또한, 악의적인 클라이언트가 백도어 공격(Doorping 등)을 수행하는 경우에 대한 프레임워크의 강력성을 평가하고, 충분한 수의 클라이언트가 참여한다는 가정 하에 강력함을 보여준다. 실험 결과는 SFDD의 효과와 제안된 방어 기법이 식별된 취약성을 실질적으로 완화하며, 증류된 데이터셋의 성능에 미치는 영향은 최소화함을 보여준다. 결론적으로, 이 연구는 데이터셋 증류에서 개인정보 보호와 연합 학습 간의 상호 작용을 다룸으로써 개인정보 보호 머신러닝 분야를 발전시키고, SFDD 프레임워크를 민감한 데이터 공유 애플리케이션에 적용할 수 있는 실현 가능한 솔루션으로 제시한다.