본 논문은 제어 가능한 확산 모델 생성을 KL-정규화된 목적 함수를 최적화하는 분포를 찾는 문제로 정의합니다. 기존의 강화 학습(RL) 기반 미세 조정 방식의 과적합 및 많은 자원 소모 문제를 해결하기 위해, SLCD(Supervised Learning based Controllable Diffusion)를 제안합니다. SLCD는 반복적으로 온라인 데이터를 생성하고, 작은 분류기를 훈련하여 확산 모델의 생성을 유도합니다. RL이나 제어 이론의 복잡한 개념 없이 분류를 주요 연산으로 사용하며, KL 발산 하에서 SLCD의 출력이 KL-정규화된 목적 함수의 최적 해에 수렴함을 증명합니다. 실험적으로 연속 확산 기반 이미지 생성과 이산 확산 기반 생물학적 서열 생성에서 기본 모델과 거의 동일한 추론 시간으로 고품질 샘플을 생성함을 보여줍니다.