확산 기반 생성 모델의 최근 발전은 오프라인 데이터셋을 활용하여 장기간, 희소 보상 작업을 해결하는 데 상당한 가능성을 보여주었습니다. 하지만 이러한 접근 방식은 실행 불가능한 궤적을 생성하는 고유한 확률적 위험으로 인해 신뢰성이 일관되지 않아 안전이 중요한 응용 분야에서의 적용이 제한됩니다. 본 논문에서는 이러한 실패의 주된 원인이 샘플링 과정 중 부정확한 안내임을 밝히고, 안내 간격에 대한 하한을 도출하여 다양체 편차의 존재를 증명합니다. 이러한 과제를 해결하기 위해, 본 논문에서는 오프라인 데이터셋에서 근사된 저차원 부분 공간에 안내된 샘플을 투영하여 실행 불가능한 궤적 생성을 방지하는, 훈련이 필요 없는 방법인 LoMAP(Local Manifold Approximation and Projection)을 제안합니다. 도전적인 장기 계획이 포함된 표준 오프라인 강화 학습 벤치마크에서 제안된 방법을 검증합니다. 또한, 독립 모듈로서 LoMAP을 계층적 확산 계획기에 통합하여 성능을 더욱 향상시킬 수 있음을 보여줍니다.