본 논문은 자율 주행 및 인간-로봇 상호작용과 같은 자율 시스템 애플리케이션을 위한 현실적인 시뮬레이션 생성의 중요성을 강조합니다. 기존의 규칙 기반 모델은 다양한 행동 생성에 어려움을 겪고 세심한 조정이 필요하며, 학습 기반 방법은 데이터에서 정책을 모방하지만 규칙을 명시적으로 따르도록 설계되지 않았다는 한계를 지적합니다. 본 연구는 Signal Temporal Logic (STL)과 확산 모델을 활용하여 제어 가능하고, 다양하며, 규칙을 인식하는 정책을 학습하는 새로운 방법을 제시합니다. 실제 데이터를 사용하여 STL을 보정하고, 궤적 최적화를 통해 다양한 합성 데이터를 생성한 후, 확장된 데이터셋에서 수정된 확산 정책을 학습하는 과정을 거칩니다. NuScenes 데이터셋을 사용한 실험 결과, 다른 기준 모델과 비교하여 가장 다양하고 규칙 준수적인 궤적을 생성하며, 실행 속도 또한 17배 빠른 성능을 보였습니다. 폐쇄 루프 테스트에서도 가장 높은 다양성, 규칙 만족률, 그리고 가장 낮은 충돌률을 달성했습니다. 더 나아가, 테스트 시 다양한 STL 매개변수에 따라 다양한 특성을 생성할 수 있으며, 인간-로봇 조우 시나리오에 대한 사례 연구를 통해 오라클 궤적에 가까운 다양한 궤적을 생성하는 것을 보여줍니다. 관련 코드와 데이터셋은 깃허브에서 공개합니다.