본 논문은 장기간의 접촉이 많은 두 팔을 사용하는 조작 문제를 해결하기 위해, 병렬 실행과 순차적 협업을 혼합한 복잡한 조정이 필요한 문제를 다룹니다. 이를 위해, 단일 팔 및 두 팔 기본 기술 라이브러리를 기반으로 하는 계층적 프레임워크를 제안합니다. 이 프레임워크는 강화 학습(RL)을 사용하여 GPU 가속 시뮬레이션에서 훈련된 기술과, 기술 구성을 기반으로 훈련된 Transformer 기반 플래너를 통합하여, 고수준 스케줄러 역할을 수행하며, 기술의 이산적 스케줄과 연속적 파라미터를 동시에 예측합니다.