분산된 개인 데이터셋에서 확산 모델을 학습시키기 위한 새로운 연합 학습 프레임워크를 제시합니다. 의료, 금융, 생의학 연구와 같은 민감한 분야에서 AI 채택의 주요 과제인 데이터 접근성, 규정 준수, 윤리적 데이터 소싱 문제를 해결하기 위해, 개인 정보 보호, 저작권 및 경쟁에 대한 우려로 인해 공개 데이터셋 접근이 제한되는 상황에서 고품질의 다양한 합성 데이터를 생성하는 효과적인 솔루션으로 합성 데이터와 확산 모델을 활용합니다. 이 프레임워크는 개인화 및 전방 확산 과정의 고유한 노이즈를 활용하여 강력한 차별적 프라이버시 보장을 제공하면서 고품질 샘플을 생성합니다. 실험 결과, 특히 데이터 이질성이 높은 설정에서 비협력적 학습 방법보다 성능이 우수하며, 합성 데이터의 편향과 불균형을 효과적으로 줄여 공정한 후속 모델을 만드는 것으로 나타났습니다.