단일 시연만을 프롬프트로 사용하여 이미지 생성처럼 손쉽게 에이전트의 제어 정책을 생성할 수 있는지에 대한 연구입니다. 본 논문에서는 조건부 확산 모델을 활용하여 행동에서 정책으로 생성하는 새로운 정책 매개변수 생성기인 Make-An-Agent를 제시합니다. 궤적 정보를 인코딩하는 행동 임베딩의 안내에 따라, 정책 생성기는 잠재 매개변수 표현을 합성하고, 이는 정책 네트워크로 디코딩될 수 있습니다. 정책 네트워크 체크포인트와 해당 궤적을 사용하여 훈련된 생성 모델은 여러 작업에서 놀라운 다양성과 확장성을 보여주며, 소수의 샷 시연만을 입력으로 사용하여 보이지 않는 작업에서도 우수한 성능의 정책을 출력하는 강력한 일반화 능력을 갖습니다. 다양한 목표, 행동, 그리고 서로 다른 로봇 조작기까지 포함한 다양한 도메인과 작업에서 그 효능과 효율성을 보여줍니다. 시뮬레이션을 넘어, 보행 작업에 대한 Make-An-Agent에 의해 생성된 정책을 실제 로봇에 직접 배포합니다.