본 논문은 자율 주행 시스템 설계 및 테스트에 필수적인 신뢰할 수 있는 시뮬레이션 에이전트를 제안합니다. Waymo Open Motion Dataset을 사용하여 수천 개의 시나리오에서 자가 학습을 확장하고, 제한된 인간의 인지 및 제어 능력 하에서 훈련합니다. 단일 GPU에서 하루 만에 거의 모든 훈련 세트를 해결하고, 미지의 테스트 장면에서도 99.8%의 목표 달성률을 달성하며 충돌 및 도로 이탈 사고율은 0.8% 미만입니다. 또한 분포 외 장면에 대한 부분적인 강건성을 보여주며, 몇 분 안에 미세 조정하여 거의 완벽한 성능에 도달할 수 있습니다. 본 논문은 사전 훈련된 에이전트와 배치형 다중 에이전트 시뮬레이터를 오픈 소스로 공개합니다.