본 논문은 다양한 작업, 환경, 물리적 형태에서 작동하는 일반적인 에이전트를 개발하는 어려움에 초점을 맞추고 있습니다. 로봇 운동을 테스트베드로 사용하여 인간형, 사족보행, 육족보행 로봇 등 약 1,000개의 다양한 형태를 생성하고, 다양한 관측 및 행동 공간을 가진 일반적인 정책을 무작위 하위 집합에서 훈련시켰습니다. 훈련 형태의 수를 늘리면 보지 못한 형태에 대한 일반화가 향상되며, 소수의 고정된 형태 집합에서 데이터를 확장하는 것보다 형태를 확장하는 것이 형태 수준의 일반화에 더 효과적임을 발견했습니다. 전체 데이터셋으로 훈련된 최고의 정책은 Unitree Go2 및 H1과 같은 실제의 새로운 형태로 제로샷 전이됩니다. 이러한 결과는 적응형 제어, 형태 및 제어의 공동 설계 등에 적용 가능한 일반적인 구현 지능을 향한 발걸음을 나타냅니다.