본 논문은 신경망 기반 모방 정책의 불안정성으로 인한 로봇 지능의 한계를 해결하기 위해, Curiosity-Diffuser라는 새로운 방법을 제안합니다. 이는 Random Network Distillation (RND) 기반의 curiosity module을 사용하여 모델의 행동이 훈련 데이터와 얼마나 일치하는지 평가하고, classifier guidance diffusion을 통해 curiosity를 최소화하여 추론 중 과적합을 줄이는 것을 목표로 합니다. 또한, 생성된 행동과 훈련 데이터셋 간의 유사성을 측정하는 계산 효율적인 신뢰성 평가 지표를 제안합니다. 시뮬레이션 결과, Curiosity-Diffuser가 다양한 시나리오에서 작업 성능을 향상시키고 훈련 데이터와 더 유사한 행동을 생성하는 것을 보여줍니다. 소스 코드는 github.com/CarlDegio/Curiosity-Diffuser에서 확인할 수 있습니다.