본 논문은 다양한 민첩한 보행 동작(달리기, 회전, 점프, 공중제비 등)을 동시에 학습하고 부드럽게 전환하며 다양한 응용 분야에 통합할 수 있는 강화 학습 프레임워크인 Versatile Instructable Motion prior (VIM)을 제시합니다. VIM은 동물의 움직임과 수동으로 설계된 움직임을 모방하여 다양한 민첩한 저수준 기술을 학습할 수 있도록 합니다. 기능 보상(Functionality reward)은 다양한 기술을 채택하는 로봇의 능력을 안내하고, 스타일 보상(Stylization reward)은 로봇의 움직임이 참조 움직임과 일치하도록 합니다. 시뮬레이션과 실제 환경 모두에서 VIM 프레임워크를 평가하였으며, 실제 로봇에서 단일 학습 기반 제어기를 사용하여 다양한 민첩한 보행 기술을 동시에 학습할 수 있음을 보여줍니다.