SPiDR: A Simple Approach for Zero-Shot Safety in Sim-to-Real Transfer
Created by
Haebom
저자
Yarden As, Chengrui Qu, Benjamin Unger, Dongho Kang, Max van der Hart, Laixi Shi, Stelian Coros, Adam Wierman, Andreas Krause
개요
SPiDR (Sim-to-real via Pessimistic Domain Randomization)은 시뮬레이터에서 훈련된 정책이 실제 세계에서 겪는 sim-to-real gap 문제를 해결하기 위한 알고리즘입니다. SPiDR은 도메인 무작위화를 사용하여 sim-to-real gap에 대한 불확실성을 안전 제약 조건에 통합하여 안전한 sim-to-real transfer를 가능하게 합니다. SPiDR은 기존 훈련 파이프라인과 호환되며, sim-to-sim 벤치마크 및 실제 로봇 플랫폼 실험을 통해 안전성과 성능을 입증했습니다.