Sign In

Diverse Controllable Diffusion Policy with Signal Temporal Logic

Created by
  • Haebom
Category
Empty

저자

Yue Meng, Chuchu fan

개요

본 논문은 자율 주행 및 인간-로봇 상호작용과 같은 자율 시스템 애플리케이션을 위한 현실적인 시뮬레이션 생성의 중요성을 강조합니다. 기존의 규칙 기반 모델은 다양한 행동 생성에 어려움을 겪고 세심한 조정이 필요하며, 학습 기반 방법은 데이터에서 정책을 모방하지만 규칙을 명시적으로 따르도록 설계되지 않았다는 한계를 지적합니다. 본 연구는 Signal Temporal Logic (STL)과 확산 모델을 활용하여 제어 가능하고, 다양하며, 규칙을 인식하는 정책을 학습하는 새로운 방법을 제시합니다. 실제 데이터를 사용하여 STL을 보정하고, 궤적 최적화를 통해 다양한 합성 데이터를 생성한 후, 확장된 데이터셋에서 수정된 확산 정책을 학습하는 과정을 거칩니다. NuScenes 데이터셋을 사용한 실험 결과, 다른 기준 모델과 비교하여 가장 다양하고 규칙 준수적인 궤적을 생성하며, 실행 속도 또한 17배 빠른 성능을 보였습니다. 폐쇄 루프 테스트에서도 가장 높은 다양성, 규칙 만족률, 그리고 가장 낮은 충돌률을 달성했습니다. 더 나아가, 테스트 시 다양한 STL 매개변수에 따라 다양한 특성을 생성할 수 있으며, 인간-로봇 조우 시나리오에 대한 사례 연구를 통해 오라클 궤적에 가까운 다양한 궤적을 생성하는 것을 보여줍니다. 관련 코드와 데이터셋은 깃허브에서 공개합니다.

시사점, 한계점

시사점:
STL과 확산 모델을 결합하여 제어 가능하고, 다양하며, 규칙을 준수하는 자율 시스템의 행동 생성을 가능하게 함.
기존 방법보다 훨씬 빠른 속도(1/17X)로 다양하고 규칙 준수적인 궤적 생성.
폐쇄 루프 테스트에서 높은 다양성, 규칙 만족률, 그리고 낮은 충돌률을 달성.
다양한 STL 매개변수에 따라 다양한 특성을 가진 궤적 생성 가능.
인간-로봇 상호작용 시나리오에서 효과적인 궤적 생성 가능.
코드와 데이터셋 공개를 통한 연구의 재현성 및 확장성 확보.
한계점:
본 논문에서 제시된 방법의 일반화 성능 및 다양한 환경에 대한 적용 가능성에 대한 추가적인 연구 필요.
실제 도로 환경의 복잡성을 완벽하게 반영하지 못할 가능성.
STL을 이용한 규칙 정의의 복잡성 및 제약.
👍