본 논문은 인간의 고난이도 동작(쿵푸, 춤 등)을 모방하여 휴머노이드 로봇이 다양한 기술을 습득할 수 있는 물리 기반 제어 프레임워크를 제시한다. 기존 알고리즘의 한계인 부드럽고 느린 동작만 추적 가능하다는 점을 극복하고자, 다단계 동작 처리 및 적응적 동작 추적을 통해 고난이도 동작 모방을 가능하게 한다. 동작 처리는 동작 추출, 필터링, 보정, 재타겟팅 파이프라인으로 구성되며, 물리적 제약 조건 준수를 최대화한다. 동작 모방을 위해 현재 추적 오차에 기반하여 추적 정확도 허용치를 동적으로 조절하는 적응적 커리큘럼 메커니즘을 갖춘 이중 수준 최적화 문제를 정식화하고, 정책 훈련을 위한 비대칭 액터-크리틱 프레임워크를 구성한다. 실험 결과, 고난이도 동작을 모방하는 전신 제어 정책을 성공적으로 훈련하여 기존 방법보다 훨씬 낮은 추적 오차를 달성했으며, Unitree G1 로봇에 적용하여 안정적이고 표현력 있는 동작을 시연했다.