본 논문은 확산 계획(diffusion planning)이라는 의사결정 문제 해결 방식에 대한 연구를 다룹니다. 기존 연구들의 확산 계획 설계에서 일관성이 부족하고 주요 구성 요소의 작동 원리가 불분명한 점을 해결하기 위해, 오프라인 강화학습 환경에서 6,000개 이상의 확산 모델을 훈련 및 평가하는 체계적인 실험을 진행했습니다. 그 결과, 유도 샘플링, 네트워크 아키텍처, 행동 생성, 계획 전략 등의 중요 구성 요소에 대한 실질적인 통찰을 얻었습니다. 특히, 기존 연구의 일반적인 관행과 반대되는 설계 선택(예: 선택을 포함한 무조건 샘플링이 유도 샘플링보다 우수함, Transformer가 U-Net보다 성능이 좋음)이 더 나은 성능으로 이어진다는 것을 밝혔습니다. 이러한 통찰력을 바탕으로, 표준 오프라인 강화학습 벤치마크에서 최첨단 결과를 달성하는 간단하면서도 강력한 확산 계획 기준 모델을 제시합니다.